mirror of
https://github.com/yacy/yacy_search_server.git
synced 2025-01-22 05:08:42 -05:00
ee277b9b3e
if file in DATA/SETTINGS it is loaded otherwise file in ./defaults is loaded (if locale ./defaults/stopwords.xx doesn't exist take solr/lang/stopwords_xx.txt as default) move yacy.stopwords, yacy.stopwords.de and yacy.badwords.example out of root directory to ./defaults directory
70 lines
1.0 KiB
Plaintext
70 lines
1.0 KiB
Plaintext
#Deutsche Stopwords.
|
|
|
|
#Diese Datei wurde mit dem Programm YaWoStat erstellt. Als Textkorpus kamen eine deutsche Übersetzung der Bibel und eine Unmenge Webseiten zum Einsatz.
|
|
|
|
#Falls jemand diese Datei ergänzen möchte, bitte ich folgendes zu bedenken:
|
|
#Ich habe über jedes Wort einzeln nachgedacht, ob mir spontan Suchanfragen einfallen, die es rechtfertigen würden, dieses Wort zu indexieren.
|
|
#Hier musste ein Mittelweg zwischen Komfort (alle Worte indexieren) und Effizienz und Speicherplatzverbrauch (möglichst wenig Worte indexieren) gefunden werden.
|
|
|
|
#Ich denke, diese Datei stellt erst mal einen guten Mittelweg dar und kann _vorsichtig_ im Laufe der Zeit ergänzt werden, wenn der Ergänzende gut darüber nachdenkt.
|
|
|
|
die
|
|
der
|
|
und
|
|
in
|
|
von
|
|
das
|
|
den
|
|
zu
|
|
für
|
|
ist
|
|
mit
|
|
auf
|
|
sie
|
|
im
|
|
eine
|
|
des
|
|
sich
|
|
nicht
|
|
dem
|
|
auch
|
|
als
|
|
zum
|
|
bei
|
|
wird
|
|
es
|
|
mehr
|
|
hat
|
|
an
|
|
oder
|
|
werden
|
|
aus
|
|
sind
|
|
er
|
|
ich
|
|
in
|
|
aber
|
|
es
|
|
du
|
|
daß
|
|
dass
|
|
ihr
|
|
ein
|
|
so
|
|
denn
|
|
an
|
|
da
|
|
ihm
|
|
wie
|
|
hat
|
|
euch
|
|
ihn
|
|
vor
|
|
sein
|
|
aus
|
|
nach
|
|
seine
|
|
werden
|
|
mir
|
|
was
|
|
ihnen |