Überarbeitung der Wortliste

Moderator: Moderatoren

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Di Aug 30 2011 2:16

OMG Roman, das muss eine Höllen-Arbeit gewesen sein.

Applaus, Applaus, Applaus Bild

Benutzeravatar
Avorninnas
Beiträge: 1498
Registriert: Mo Mär 12 2007 22:58

Beitrag von Avorninnas » Di Aug 30 2011 7:18

Dem kann ich mich nur anschließen.

Faerphin
Beiträge: 59
Registriert: So Jul 04 2010 13:45

Beitrag von Faerphin » Di Aug 30 2011 8:23

Das ist großartig ! Ich bin begeistert von all den neuen Wörter, und ebenso von dem Umstand eine wirklich brandaktuelle Liste zu haben.

Vielen vielen Dank für all die Mühen !

Ailinel
Beiträge: 1715
Registriert: Fr Mär 16 2007 11:53

Beitrag von Ailinel » Di Aug 30 2011 9:11

Ja, vielen Dank!

Gestern war ich noch etwas am Überlegen, ob nicht gleichlautende Wörter mit unterschiedlicher Etymologie evtl. jeweils separate, nummerierte Einträge erhalten sollten (wie in Hiswelóke), aber nein, da käme ja sofort die riesige Grauzone der von Tolkien ab Etym. veränderten Wortstämme ins Spiel! So, mit den jeweiligen Referenzen hinter jedem als gültig/in Sindarin verwendbar erachteten Wort, ist es wirklich am besten.

Eventuelle Detailprobleme werde ich (wenn überhaupt) nur zufällig, bei konkreten Recherchen, bemerken, daher werde ich die Wortliste so viel wie möglich verwenden.

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » So Sep 04 2011 23:23

Okay, die Wortlisten sehen gut aus und sind nun auch von der Hauptseite aus erreichbar:
http://www.sindarin.de/lexikon.html
Die einzelnen Teile lassen sich auch über die folgenden Links aufrufen:
http://www.sindarin.de/sindarin_sd.html
http://www.sindarin.de/sindarin_ds.html

Auf einige Dinge möchte ich nochmals hinweisen:

- Auf der Seite der Abkürzungen habe ich die in den Wortlisten benutzten Regularisierungen hineingestellt.

- Es ist technisch etwas umständlich, mehr als eine Alternativform zu führen. Für die Deutsch-Sindarin-Wortliste wäre es noch kein Problem, da die Wörter einfach in Klammern hinter den Haupteintrag kommen, aber bei der Sindarin-Deutsch-Liste muss man sie mit einsortieren. Der Einfachheit halber führe ich nur eine einzige Alternativform. Das beträfe auch nur ganz wenige Einträge:

hen, hend, henn
hwand, chwann, chwand
iôn, ion, ionn
nan, nann, nand
fen, fenn, fend
gwen, gwenn, gwend


Ich habe immer die am häufigsten, bzw. in kanonischen Quellen vorkommende Form als Zitierform genommen, also hen (siehe Amon Hen), ion, nan, fen, gwen. Beim "Schwamm" sind die Einträge etwas komisch (chwann, aber kein *hwann?). Mein Motto ist: Wenn ich es nicht verstehe, versuche ich nicht, es zu verbessern. Somit habe ich hwand, chwand aufgenommen.
Die Wörter taor, †taur < †tachaur und nâr, nadhor < nadhr kriegen zwei Einträge spendiert, da sich hier die Endformen doch recht stark unterscheiden.

- Ich habe die Dölchlein für die archaischen/poetischen Formen eingefügt. Bei der Sindarin-Deutsch-Liste stehen sinnvollerweise vor der deutschen Übersetzung, z.B.:

dîr s† Mann [nd-] (Ety/354, Ety/352); adj schwer; adj schwierig (PE/17:154)

Nur die erstere Bedeutung ist archaisch/poetisch. Umgekehrt herum stehen sie natürlich vor dem Sindarin-Wort:

Mann: s benn (Ety/352, VT/45:9); s †dîr [nd-] (Ety/354, Ety/352).

- In PE/17:45 kommt als eines der Wörter für "Zwerg" noegin vor. Das ist etwas zweideutig und könnte sowohl für *nœgin < *nog- stehen, als auch ein Diphthong sein noegin < *naug-. Da in verwandten Notizen (nächste Seite) auch *nœgid mit einer Ligatur vorkommt, interpretiere ich noegin als Diphthong, füge aber einen entsprechenden Kommentar ein.

- In den Etymologies ist N. dôl von ndolo abgeleitet und hat den Plural duil. Später findet man aber doll in Klammern zu dol (mit kurzem Vokal) dazugeschrieben. Die Etymologie hat sich also geändert, sodass doll, dol vermutlich eher nicht mehr den Plural duil hat, da so eine Diphthongisierung vor einzelnen Konsonanten zu geschehen scheint. Die beiden Wörter kriegen damit zwei verschiedene Einträge.
Übrigens scheint es trotz der Lenition Fanuidhol nicht so zu sein, dass der Wortstamm von NDOL- auf *DOL- geändert wurde, wegen Q. Russandol (PM), weshalb ich beide Einträge mit [nd-] markiere.

------------------------------------------------------------------------------

Ich weiß nicht, ob ihr die sindict-Diskussion zu Zusammenarbeit in Bezug auf Wortlisten verfolgt habt, aber es wäre sehr relevant zu lesen.
Ich möchte jedenfalls, dass sich jeder an der Arbeit an den Wortlisten beteiligen kann, und es geht auch ganz einfach: Die SQL-Datenbank erlaubt einen Import aus Dateien. Man muss lediglich ein Tabellenkalkulationsdokument mit den folgenden Spalten erstellen:

1. deutsche Übersetzung (Da die elbischen Wörter normalerweise mit einer Reihe englischer übersetzt werden, muss für jede Übersetzung eine neue Zeile angelegt werden.)
2. deutsche Übersetzung für Sortierung ohne Umlaute und mit ss=ß, also z.B. "grussen" statt "grüßen" (Ich bin mir nicht sicher, ob das wirklich nötig ist, aber so war das eben in der Wortliste schon drin und ich lasse es so.)
3. Marker der Rekonstruktion ("0" oder leer, falls attestiert; "1", falls rekonstruiert)
4. Sindarin-Wort
5. Marker der Rekonstrutkion des Alternativwortes ("0" oder leer, falls attestiert; "1", falls rekonstruiert)
6. Sindarin-Alternativwort
7. Anzahl der rekonstruierten Plural-Wörter ("0" oder leer, falls alle attestiert)
8. Sindarin-Pluralwörter mit Komma getrennt, die rekonstruierten kommen zuerst
9. Sondermutation ("nd-", "ñg-" oder "mb-")
10. Wortklassifikationen (siehe Abkürzungen-Seite)
11. Wortkart (siehe Abkürzungen-Seite; ohne den Punkt)
12. Referenzen (Man beachte den Hiswelóke-Stil mit dem Schrägstrich VT/xx:xx)

Einträge lassen sich auch ohne Tabellenkalkulation eingeben, dann muss jede Spalte mit einem Semikolon getrennt werden. Sie können in Anführungszeichen stehen, müssen es aber nicht. Zum Beispiel sehen einige so aus:

"Heim";"Heim";"0";"bâr";"0";"bar";"0";"bair";"mb-";;"s";"S/428, WR/379-80, SD/129-31, PE/17:97,109,163-164"
"dritter";"dritter";"0";"nail";"0";"neil";"1";"nîl";;"num.";"adj";"VT/42:25"

Damit kann mir jeder neue Einträge zukommen lassen - am einfachsten in der oberen Form ins Forum schreiben; oder aber in eine Textdatei (utf-8-Kodierung), oder in einem Tabellenkalkulationsprogramm schreiben und als Textdatei exportieren.
Zum Beispiel habe ich gemerkt, dass bei Hiswelóke die Wörter aus VT45&46 irgendwie sehr selektiv aufgenommen wurden, einige wurden ignoriert. Ein paar, über die ich zufällig gestolpert bin, sind harwed, harfen, poen, dufui, hest. Um sie aufzunehmen, schreibt man folgendes:

linkshändig;linkshandig;;harwed;;;;;;arch./poet.;adj;VT/45:23
Südregion;Sudregion;;harven;;;;hervin;;;s;VT/45:23, X/PH
Möwe;Mowe;;paen;;;;;;zool., arch./poet.;s;VT/45:24, X/OE
trist;trist;;duvui;;;;;;;adj;VT/45:11, X/PH
düster;duster;;duvui;;;;;;;adj;VT/45:11, X/PH
Kapitän;Kapitan;;hest;;;;;;mask.;s;VT/45:22

Ich hab's ausprobiert - es funktioniert. Es sind aber bestimmt noch mehr Wörter drin, die man aufnehmen kann. Genauso lässt sich vorgehen, wenn wieder mal eine neue Publikation mit Vokabeln herauskommt, ich aber keine Zeit für die Wortlisten habe. Die Einträge können dann von vielen Personen über eine beliebige Zeit gesammelt werden, und ich brauche sie nur hochzuladen.

Ailinel
Beiträge: 1715
Registriert: Fr Mär 16 2007 11:53

Beitrag von Ailinel » Di Sep 06 2011 10:05

Die Wortlisten sind jetzt ausgezeichnet, ich bin begeistert!
Vielen Dank nochmals!

Die sindict-Seite habe ich seit langem nicht besucht, danke für den Hinweis. Tatsächlich stoße ich ab und zu auf Wörter, bei denen ich mich frage, weshalb sie in Wortlisten nicht aufgenommen wurden. Allerdings bin ich dann oftmals im Zweifel, ob sie wirklich übersehen wurden oder ob es offensichtliche Gründe gibt, sie auszuschließen, die nur ich gerade nicht erkenne, bei meinem begrenzten Wissen, oder bedingt durch ein momentanes Blackout oder was auch immer.

So zum Beispiel gerade heute (anlässlich dieser Übesetzung von Salmar) das Wort dim, 'gloom, sadness' (*dimbê), Ety:354. Es ist dort keine Sprache ausdrücklich angegeben, aber das trifft auf dem ebenso zu, und ich hätte beide dem Noldorin zugerechnet, auch unter Einbeziehung von VT45. Andererseits kommt es mir total unwahrscheinlich vor, dass dim (nicht nur von Didier) zufällig übersehen wurde...
- Ich habe die Dölchlein [..] eingefügt.
Ah, Dölchlein! Dölchlein, das Wort ist cool!

Benutzeravatar
Avorninnas
Beiträge: 1498
Registriert: Mo Mär 12 2007 22:58

Beitrag von Avorninnas » Di Sep 06 2011 12:02

Ailinel hat geschrieben:Ah, Dölchlein! Dölchlein, das Wort ist cool!
In der Tat. Genial :biggrin:
**Man aníranneg na higileg, pedo...!? *rumblödel*

Was mir gerade noch auffiel, sich aber auf die Grammatik und weniger auf die Wortlisten bezieht: Vielleicht wäre der Vollständigkeit halber noch ein kurzer Eintrag zu möglichen Verkleinerungsformen bei den Substantiven ganz brauchbar. Es sei denn, er existiert bereits und ich habe ihn einfach mal wieder übersehen.

Mir geht es wie Ailinel. Manchmal stolpere ich über Worte, die Didier nicht aufgenommen hat und bin mir nicht sicher, weshalb. Ich sage Bescheid, wenn es wieder passiert.

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Di Sep 06 2011 13:09

Allerdings bin ich dann oftmals im Zweifel, ob sie wirklich übersehen wurden oder ob es offensichtliche Gründe gibt, sie auszuschließen, die nur ich gerade nicht erkenne, bei meinem begrenzten Wissen, oder bedingt durch ein momentanes Blackout oder was auch immer.
Im Zweifelsfall immer vorbringen - selbst wenn man diese Wörter aus irgendeinem Grund nicht guten Gewissens Sindarin nennen kann, kann man sie immer noch *Sindarin nennen, d.h. sie bilden eine besser Grundlage für Rekonstruktionen als freie Mutmaßungen.
Z.B. scheinen die durchgestrichenen N. lhûr 'slumber' und lhorn 'asleep' die einzigen späten attestierten Wörter für "Schlaf" etc. zu sein, was man in Neo-Sindarin durchaus häufig braucht; weshalb ich sie in die Liste aufgenommen habe.
So zum Beispiel gerade heute (anlässlich dieser Übesetzung von Salmar) das Wort dim, 'gloom, sadness' (*dimbê), Ety:354. Es ist dort keine Sprache ausdrücklich angegeben, aber das trifft auf dem ebenso zu, und ich hätte beide dem Noldorin zugerechnet, auch unter Einbeziehung von VT45. Andererseits kommt es mir total unwahrscheinlich vor, dass dim (nicht nur von Didier) zufällig übersehen wurde...
Ganz vorne steht ja "Ilk.":
Ilk. dimb 'sad', dim 'gloom, sadness', dem 'sad, gloomy'
Alle drei dürften also Ilkorin sein.
Was mir gerade noch auffiel, sich aber auf die Grammatik und weniger auf die Wortlisten bezieht: Vielleicht wäre der Vollständigkeit halber noch ein kurzer Eintrag zu möglichen Verkleinerungsformen bei den Substantiven ganz brauchbar. Es sei denn, er existiert bereits und ich habe ihn einfach mal wieder übersehen.
Existiert noch nicht, ist aber eine gute Idee.

Ailinel
Beiträge: 1715
Registriert: Fr Mär 16 2007 11:53

Beitrag von Ailinel » Di Sep 06 2011 14:18

Ganz vorne steht ja "Ilk.":
Ilk. dimb 'sad', dim 'gloom, sadness', dem 'sad, gloomy'
Alle drei dürften also Ilkorin sein.
Wenn dies der Konsens der Experten ist, dann frage ich mich, aus welchem Grund dem trotzdem in Sindarin-Wortlisten angeführt wird, aber dim nicht.

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Di Sep 06 2011 18:35

Wenn dies der Konsens der Experten ist, dann frage ich mich, aus welchem Grund dem trotzdem in Sindarin-Wortlisten angeführt wird, aber dim nicht.
Trau' dich es zu sagen - es ist ein Fehler. Überhaupt ist das Problem mit den Wortlisten, dass sie gerade nicht auf einem Konsens beruhen, sondern auf Interpretationen von Salo und Fauskanger aus uralter Zeit. Der letztere führt alle drei Wörter im Ilkorin-Artikel auf, in 'The question of ND or NN' tauchen aber dim und dem als 'Noldorin/Sindarin' auf.
Hiswelóke kommentiert dem mit No language indication in the Etymologies, but Noldorin from context and phonological evidence. Nun, erstmal *ist* ein Sprachkürzel mit angegeben, nämlich "Ilk.", solhce sind für Qenya und Noldorin ja auch nicht vor jedem Eintrag wiederholt. Wenn sich 'phonological evidence' auf die a-Umlautung bezieht, so hat Ilkorin sie auch, z.B. toga-, rest.
Das einzige Problem hier ist, dass Dimbar auch im Silmarillion (unübersetzt) auftaucht. Das heißt dann aber auch nicht, dass es Sindarin sein muss, und man weiß auch nicht, ob das erste Element isoliert #dem oder #dim wäre.

Benutzeravatar
Eirien
Moderator
Beiträge: 2091
Registriert: Do Mär 15 2007 13:23

Beitrag von Eirien » Mi Sep 07 2011 6:41

Ist ja krass, ein vorgezogenes Weihnachtsgeschenk mitten im... öhm... Frühherbst! Das muss ja eine Heiden-Arbeit gewesen sein, also erstmal ein ganz großes Bild!

Ich habe mir die Dateien zum Offline-Arbeiten heruntergeladen, auch das funktioniert problemlos, und werde ab jetzt fleißig damit arbeiten!

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Mi Sep 07 2011 21:30

Ist ja krass, ein vorgezogenes Weihnachtsgeschenk mitten im... öhm... Frühherbst!
Der 17. September ist der Gedenktag der St. Hildegard von Bingen, der ersten bekannten Spracherfinderin. Und am 19. ist der internationale 'Talk Like A Pirate Day'. Wenn das nicht mal zwei Anlässe sind... ;-)

Benutzeravatar
Lúthien Meliel
Beiträge: 79
Registriert: Do Jun 26 2008 21:58
Kontaktdaten:

Beitrag von Lúthien Meliel » Do Sep 08 2011 9:09

Wow, that's quite an accomplishment! Congratulations :)

As you know from Eryniel, I'm experiencing some friction with Didier Willis, whose wordlist I was using to create a dictionary application with. To be honest, I have no idea whatsoever what his problem is, but Eryniel suggested to me that we might better use the list that you compiled. Anyhow, you know about that because you already talked to her.

I just wanted to say that I'm very happy to go that route. It's probably also a hell of a lot easier, because Didier's TEI XML format wasn't very easy to rework in a usable format (SQL); actually, that's what usurped the most time and effort. On top of that, looking strictly as a programmer (I'm not a linguist like him) - I think that TEI is maybe a very interesting format if you really go into full-scala cataloguing of a language like French or German that has a base of hundreds of thousands of words. But the Sindarin vocabulary is still quite manageable, so I think that using TEI for a Sindarin Dictionary that is like using a Boeing 747 to go shopping for groceries.

I'm not sure in what format your sources are now - but I'll first read this topic through a bit more carefully, or else I'll pm you on Parendili :)

I'm also glad to get this going again!

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Do Sep 08 2011 12:47

But the Sindarin vocabulary is still quite manageable, so I think that using TEI for a Sindarin Dictionary that is like using a Boeing 747 to go shopping for groceries.
I'm not claiming to know anything about XML, but that's the same impression I got. Sometimes I do have involved searches - like all words with a certain combination of sounds in a certain source, or something like that - but nothing which cannot be done by an SQL query.
I'm not sure in what format your sources are now - but I'll first read this topic through a bit more carefully
SQL database with the following columns:
1. word id
2. German entry
3. German entry with replaced ä, ö, ü, ß for sorting (I don't know why it's necessary, but this how I received it)
4. reconstruction marker (integer 0 or 1)
5. Sindarin entry
6. Sindarin alternate word reconstruction marker (integer 0 or 1)
7. Sindarin alternate entry
8. amount of Sindarin reconstructed plurals (integer)
9. list of Sindarin plurals with the reconstructed ones coming first (see for example the doron entry with 1 reconstructed and 3 attested plurals)
10. special case mutation (3-character-string "nd-", "mb-" or "ñg-")
11. pronunciation (I use it for selected cases only)
12. word type (mask./fem., arch./poet., zool., bot. and so on, the type of mutation for prepositions is also mentioned here)
13. part of speech
14. url (linking back to chapters in the grammar and the thematic wordlist)
15. references

There is a second table for commenting the problematic cases (which is joined with the above list in the php script), it has:
1. Sindarin word
2. reference
3. comment
This is convenient because those comments refer to specific Sindarin words, whereas the main list makes new entries for each German translation.

The collation was utf8_general_ci, but I had to change it to utf8_unicode_ci for the Sindarin entries in order to sort œ properly as oe.

That's all the relevant information I can think of right now. Tell me what you need and I'll send it to you. How are you planning the next steps? Do you want to go through the German list and put back Tolkien's English glosses?
In any case, it'd be great to have a common English/German database once again.

Benutzeravatar
Maewen
Beiträge: 1069
Registriert: Di Mär 13 2007 17:59
Wohnort: Korpilahti (FI)

Beitrag von Maewen » Fr Sep 09 2011 12:51

Roman hat geschrieben: 3. German entry with replaced ä, ö, ü, ß for sorting (I don't know why it's necessary, but this how I received it)
I think I remember we had to replace umlauts and ß, because SQL would somehow treat them as special characters and sort them at the end of the alphabet. In order to be usable by German speakers, who would treat an "ä" like an "a" when looking it up in any ordinary dictionary, it has to be that way. Also, for anyone with a keyboard which does not provide umlauts or ß, it is thus possible to type just "a", "o", "u" or "ss". Try it and look up "schräg" and "schrag" via the search function. The only problem is, that you do not find the word when you type "schraeg" as any native speaker without umlauts on the keyboard would probably do it. Maybe you just add a comment about that below the search box?!

Antworten