Wie lange Tabellen auslesen?

**nobody0** · 15-07-2006, 15:13

Ich brauche eine Tabelle in PostgreSQL Zeile für Zeile ausgelesen und weil es ein paar Millionen Zeilen sind, die nicht in das RAM passen, geht das mit SELECT * nicht.
Irgendwelche Vorschläge?

**Romanday** · 15-07-2006, 18:22

Zitat von nobody0

Ich brauche eine Tabelle in PostgreSQL Zeile für Zeile ausgelesen und weil es ein paar Millionen Zeilen sind, die nicht in das RAM passen, geht das mit SELECT * nicht.
Irgendwelche Vorschläge?

RAM kaufen.

**Turbohummel** · 16-07-2006, 07:37

SELECT ..... LIMIT 0,1
SELECT ..... LIMIT 1,2
SELECT ..... LIMIT 2,3
usw.

**nobody0** · 16-07-2006, 10:01

Zitat von Turbohummel

SELECT ..... LIMIT 0,1
SELECT ..... LIMIT 1,2
SELECT ..... LIMIT 2,3
usw.

Die Angabe mit dem Komma funktioniert nicht:

ERROR: LIMIT #,# syntax is not supported
HINT: Use separate LIMIT and OFFSET clauses.

Es geht aber so:

SELECT * FROM foo ORDER BY bar,bar1 LIMIT 1 OFFSET 0;

usw.

**Turbohummel** · 16-07-2006, 15:45

Achja, SQL-Dialekte

Hätte vielleicht mal ganz lesen sollen.

**elrond** · 17-07-2006, 08:24

wenn du die daten effektiv verarbeiten willst, solltest du mit blöcken von datensätzen arbeiten. also "select ... limit 100 offset 0" usw. An dieser stelle mit der Blockgrösse rumzuspielen kann erheblich performance bringen. ob 100 oder 10000 datensätze das optimum sind,kannst du nur testen..

**nobody0** · 18-07-2006, 08:25

Ja, mir ist schon aufgefallen, dass es ohne Blöcke relativ langsam ist.
Wenn es mit Blöcken noch zu langsam ist, kann ich ja noch zusätzlich einen binären Cursor nehmen.

**Turbohummel** · 18-07-2006, 17:58

Kommt drauf an was du mit den Datensätzen machst. Wenn du da 20 weitere Updates/Inserts anstößt, machen die eine Query den Bock auch nicht mehr fett.

**nobody0** · 20-07-2006, 19:18

Also ich lese die Daten nur aus, aber das funktioniert nur bei relativ wenig Zeilen gut; bei einige Millionen wird das Auslesen immer langsamer, obwohl PostgreSQL heftige Platten-Aktivität verursacht und obwohl die Daten mittels

CREATE UNIQUE INDEX data_index ON data (foo, foo1);

geordnet sind und ich mit

SELECT * FROM data ORDER BY foo,foo1 LIMIT %d OFFSET %d

auslese. Ein Speicherleck ist nicht vorhanden.
Irgendwelche Vorschläge?

**Romanday** · 20-07-2006, 20:31

Zitat von nobody0

Irgendwelche Vorschläge?

Mein Ratschlag wurde nicht verstanden.
Dann mußt Du den Weg der Schmerzen gehen.

**Jinto** · 25-07-2006, 21:25

Meiner Theorie nach, hast du 3 Probleme:
1. Du hast Postgres nicht konfiguriert
2. Du hast im Postgres Handbuch die Sektion über die Limit/Offset Funktion übersprungen.
3. Fehlende Beweis deiner Theorien (z.B. "Millionen Zeilen sind, die nicht in das RAM passen, geht das mit SELECT * nicht." oder "Ein Speicherleck ist nicht vorhanden")

Meine Behauptung:
Cache zu grosss eingestellt und das Ding swappt sich zu tode.

Nun gilt es mich zu widerlegen.

**nobody0** · 26-07-2006, 08:17

Wieso sollte bei einfachen Anfragen geswappt werden?

Im Programm habe ich vor jedem PQexec ein PQclear, so daß sowohl bei Postgres als auch beim Programm der Speicherbedarf konstant sein sollte.
Beim Programm sehe ich auch, dass der Pointer zu den Daten-Blöcken konstant ist.

Das Postgres ist konfiguriert; das wird beim SuSE schon lauffähig installiert.

**elrond** · 26-07-2006, 08:21

Zitat von nobody0

Das Postgres ist konfiguriert; das wird beim SuSE schon lauffähig installiert.

ja lauffähig und ordentlich konfiguriert sind zwei dinge...

ist der cache der db so gross, dass er nicht in den arbeitsspeicher passt, werden die cache-daten auf die platte ausgelagert; das kostet zeit.
Das ist ein prozess, den du im programm nicht beeinflussen kannst.

**nobody0** · 26-07-2006, 23:00

Und was genau heißt groß?
Welche Muster-Konfiguration empfehlen denn die Experten hier?

**nobody0** · 28-07-2006, 13:47

Aufgefallen ist mir auch, das Postgres auch Minuten nach den Abfragen, also im "Leerlauf", noch heftig auf der Platte arbeitet. Woran kann das liegen?

Thema: Wie lange Tabellen auslesen?

Themen-Optionen

Thema bewerten

Anzeige

Wie lange Tabellen auslesen?

Lesezeichen

Lesezeichen

Berechtigungen