OK, I understand what you mean - but as far as I can see, the results of this "distinguishing entries by meaning" is not available in your dataset., but they ARE available on the website. Where did you store the information how to group the entries like you did?Roman wrote:I should explain how the entries are constructed. Tolkien's translations have often variations, so one has to decide whether they're the same word or not. For example, we find:
paran 'naked, bare' PE/17:86
paran 'bald, bare' PE/17:171
paran 'smooth, shaven' RC/433
I think these three are reasonably close, so they get slammed together into one entry:
paran 'naked, bare, bald, smooth, shaven' PE/17:86,171, RC/433.
But then we also encounter something like this:
ogol 'gloom(y)' PE18:88
ogol 'bad, evil, wrong PE17:170, VT/48:32
ogol untranslated PE/17:149
'Gloomy' and 'evil' are not quite the same thing, and the untranslated gloss could be either, so there should be two entries:
ogol 'gloom(y)' PE18:88, PE/17:149
ogol 'bad, evil, wrong PE17:170, VT/48:32, PE/17:149
This is all about external homophones so far. The procedure runs into problems when there are internal homophones appearing on the same page:
pann (*pand) 'courtyard' Ety/380
pann 'wide' Ety/380
These can be distinguished by the alternate form (indicating a different etymology). This may also fail, however:
lorn 'asleep' VT45:29
lorn 'quiet water, anchorage, haven, harbour' VT45:29
Here I had to alter the reference manually by including the etymology:
lorn 'asleep' VT45:29, LOR-
lorn 'quiet water, anchorage, haven, harbour' VT45:29, LUR-
Überarbeitung der Wortliste
Moderator: Moderatoren
- Lúthien Meliel
- Posts: 79
- Joined: Thu Jun 26 2008 21:58
The editorial procedure of joining the references is already done in the wordlists: For example, the entries "böse, boshaft, falsch (moralisch), schlecht (moralisch)" all have the reference PE/17:149,170, VT/48:32, the entries "düster, Düsterkeit" all have the reference PE/18:88, PE/17:149.
The rest is handled in the php script, this is how it looks for the creation of the html lists right now:
http://www.sindarin.de/createhtmlfiles.phps
The condition
It's probably not the most elegant program, but since I never dealt with php before working on the wordlists either, I took a beat-it-with-a-stick-until-it-works approach.
The rest is handled in the php script, this is how it looks for the creation of the html lists right now:
http://www.sindarin.de/createhtmlfiles.phps
The condition
determines linebreaks, and the conditionif( $lastWord != $line['sind'] || ($lastWord = $line['sind'] && $lastWord_alt != $line['sind_alt']) || ($lastWord = $line['sind'] && $lastWord_rek != $line['srek']) || ($lastWord = $line['sind'] && $lastWord_alt = $line['sind_alt'] && $lastWord_altrek != $line['saltrek']))
sets a common reference for a group of translations.if( $line['rf'] != $nextline['rf'] || $line['sind'] != $nextline['sind'] || $line['sind_alt'] != $nextline['sind_alt'])
It's probably not the most elegant program, but since I never dealt with php before working on the wordlists either, I took a beat-it-with-a-stick-until-it-works approach.
- Lúthien Meliel
- Posts: 79
- Joined: Thu Jun 26 2008 21:58
ahhhh thanks!Roman wrote:The editorial procedure of joining the references is already done in the wordlists: For example, the entries "böse, boshaft, falsch (moralisch), schlecht (moralisch)" all have the reference PE/17:149,170, VT/48:32, the entries "düster, Düsterkeit" all have the reference PE/18:88, PE/17:149.
The rest is handled in the php script, this is how it looks for the creation of the html lists right now:
http://www.sindarin.de/createhtmlfiles.phps
This might just have revealed an issue in the "MySQL Workbench" application that I'm using. I selected all entries from wortliste where sind = 'ogol', and I did not notice any difference in the rf column for the six rows:
I did scroll all the way to the right, but it looked just as if there is only a 'P' in that column.
So then I queried the rf column only but then it did show PE/17:149,170, VT/48:32 and PE/18:88, PE/17:149 ..?
It turns out that if you click the header of that rf column, it suddenly reveals that there's more in there:
and then I could scroll all the way to the right:
I know it's a bit offtopic, but anyhow, it makes sense now. Because I did not see anything different at first sight, I couldn't imagine what it was that you used.
OK, on with the job
- Eryniel Elmíris
- Posts: 1533
- Joined: Tue Jun 24 2008 19:51
- Location: Ribobel / Rímdor
Da ich gerade in Detailarbeit die englischen "glosses" einpflege, die fehlen, komme ich bestimmt noch das ein, oder andere Mal wieder. Hier die erste Frage:
- Wo ist eigentlich präp. ath- = easy (to do) aus PE17 geblieben?
- kann es sein, dass in der Wortliste zweimal dirbedui vorkommt - 3221
+ 3751?
- Sollte der Vollständigkeit halber nicht auch so etwas wie forlonnas und Gaerdil in der Liste vorkommen?
- Wo ist eigentlich präp. ath- = easy (to do) aus PE17 geblieben?
- kann es sein, dass in der Wortliste zweimal dirbedui vorkommt - 3221
+ 3751?
- Sollte der Vollständigkeit halber nicht auch so etwas wie forlonnas und Gaerdil in der Liste vorkommen?
Ja, das fehlte. Einige weitere Wörter, die ich übersehen habe, sind:- Wo ist eigentlich präp. ath- = easy (to do) aus PE17 geblieben?
ann 'gift' PE/17:90
†ann- 'long, far' PE/17:90
ann, annon 'gate' PE/17:90
ne 'scent' PE/17:100
oron 'tree' PE/17:153 muss als "arch./poet." gekennzeichnet werden
œryn als Alternativform zu eryn PE/17:153
nos(s) 'race, tribe, people' PE/17:169
Ja, siehe um die Duplikate ging es auf Seite 3 des Themas unten.- kann es sein, dass in der Wortliste zweimal dirbedui vorkommt - 3221
+ 3751?
Das sind ja Namen - wenn man sie in die Wortlisten mitaufnimmt, muss man da noch eine ganze Menge mehr aufnehmen.- Sollte der Vollständigkeit halber nicht auch so etwas wie forlonnas und Gaerdil in der Liste vorkommen?
- Eryniel Elmíris
- Posts: 1533
- Joined: Tue Jun 24 2008 19:51
- Location: Ribobel / Rímdor
Lieben Dank, ich flechte die von dir angegebenen Worte gleich mal ein.
Alles klar, dankeRoman wrote:Das sind ja Namen - wenn man sie in die Wortlisten mitaufnimmt, muss man da noch eine ganze Menge mehr aufnehmen.
Ich meinte eigentlich, dass das völlig identische Einträge sind, also ECHTE Doubletten.Roman wrote:Ja, siehe um die Duplikate ging es auf Seite 3 des Themas unten.
Weitere Änderungen/Hinzufügungen:
apharch VT/45:5, X/PH
**brêg verbessert zu breig, braig
caenen SD/129-131, Komm.: aus nelchaenen
caraes Ety/362, Komm.: aus Helcharaes, Q. karakse
fing RC/386
gohena- VT/44:29
hâl VT/45:20
hent VT/45:22
iôl RC/334, VT/48:33, Komm.: aus Onodiōl
linnod LotR/A(iv)
menniath TI/124
nagl, nagol WR/122, Komm.: aus Naglath
narch LotR, RC/601
neled Ety/376 (nicht aber TAI/150, VT/48:6), Komm.: in Analogie zu canad
neleg Ety/376, WR/113, VT/46:3, Pl. nelig (Das kriegt einen eigenen Eintrag, da Tolkien schreibt 'nêl or neleg'; anstatt nêl, neleg)
nerthui VT/42:10
caenui VT42/10, Komm.: von Tolkien durchgestrichen
Nornwaith MR/93, MR/106
nothlir WJ/234, WJ/237 (Achtung: hier ein Fehler in Referenzen von Hiswelóke; außerdem ist die englische Übersetzung einfach nur 'folk')
zusätzliche Referenz zu pennath: RC/525 mit Kommentar: penneth in RC/525 ist vermutlich ein Lesefehler
suilannad SD/129-131
Einige Sachen:
- Wie übersetzt man am besten 'wash, flood-water' (wie 'Entwash')? Ich habe "Flutwasser" verwendet, aber da gibt es doch bestimmt einen schicken topographischen Begriff - vielleicht "Ache" oder so?
- Der Königsbrief wird in Hiswelóke manchmal mit SD/129-131, manchmal mit SD/129-31 referenziert - das sollte man vielleicht per Suchen & Ersetzen zu SD/129-131 ändern.
apharch VT/45:5, X/PH
**brêg verbessert zu breig, braig
caenen SD/129-131, Komm.: aus nelchaenen
caraes Ety/362, Komm.: aus Helcharaes, Q. karakse
fing RC/386
gohena- VT/44:29
hâl VT/45:20
hent VT/45:22
iôl RC/334, VT/48:33, Komm.: aus Onodiōl
linnod LotR/A(iv)
menniath TI/124
nagl, nagol WR/122, Komm.: aus Naglath
narch LotR, RC/601
neled Ety/376 (nicht aber TAI/150, VT/48:6), Komm.: in Analogie zu canad
neleg Ety/376, WR/113, VT/46:3, Pl. nelig (Das kriegt einen eigenen Eintrag, da Tolkien schreibt 'nêl or neleg'; anstatt nêl, neleg)
nerthui VT/42:10
caenui VT42/10, Komm.: von Tolkien durchgestrichen
Nornwaith MR/93, MR/106
nothlir WJ/234, WJ/237 (Achtung: hier ein Fehler in Referenzen von Hiswelóke; außerdem ist die englische Übersetzung einfach nur 'folk')
zusätzliche Referenz zu pennath: RC/525 mit Kommentar: penneth in RC/525 ist vermutlich ein Lesefehler
suilannad SD/129-131
Einige Sachen:
- Wie übersetzt man am besten 'wash, flood-water' (wie 'Entwash')? Ich habe "Flutwasser" verwendet, aber da gibt es doch bestimmt einen schicken topographischen Begriff - vielleicht "Ache" oder so?
- Der Königsbrief wird in Hiswelóke manchmal mit SD/129-131, manchmal mit SD/129-31 referenziert - das sollte man vielleicht per Suchen & Ersetzen zu SD/129-131 ändern.
Oder eher 'Fenn'? Onodló sollte ja auch etwas eher Sumpfiges bezeichnen, das stelle ich mir unter einer Ache jetzt nicht vor.Roman wrote: - Wie übersetzt man am besten 'wash, flood-water' (wie 'Entwash')? Ich habe "Flutwasser" verwendet, aber da gibt es doch bestimmt einen schicken topographischen Begriff - vielleicht "Ache" oder so?
Es ist doch aber ein Flussname, nur die Mündung ist Sumpfland - das verwirrt mich. Der Gwathló 'shaded river from the fen' heißt offenbar so, weil man dachte, er entspringe im Sumpf (UT:263). Ist hier auch anzunehmen, dass der Onodló nach seiner sumpfigen Mündung benannt ist?Oder eher 'Fenn'? Onodló sollte ja auch etwas eher Sumpfiges bezeichnen, das stelle ich mir unter einer Ache jetzt nicht vor.
- Lúthien Meliel
- Posts: 79
- Joined: Thu Jun 26 2008 21:58
Another change to the datamodel, hopefully the last one!
It's not even that I cannot stop tweaking the thing, but while building prototypes I just hit upon issues that called for these changes. I'm sorry for making it look more complex than needed ...
What made me finally decide to get rid of the explicit TYPE, REF, COMMENT and FUNCTION tables (equivalent to the columns KL, RF, INFO, URL .. in the original table) was that oftentimes there was more than one "piece of information" in one field, e.g. "pa/adj", "num, präf", "arch./poet", "koll.pl.,ling." or "dim., anat." etc. - of course those could go unaltered in the corresponding tables, but well - - it just screams "normalisation!" to me.
To do that, we'll have to be able to accomodate zero-to-many relationships between TRANSLATION and the metadata tables such as TYPE so that one translation instance can have an arbitrary number of TYPE fields.
But then it's better to do it properly for all those metadata, including allowing for category names like "Type", "Ref" and "Comment" to be present in more than one language; and then it's just one more step to throw all metadata in one table, with a separate Type ("dataclass") table.
May I present therefore ... the final datamodel
This will allow maintaining all grammatical / reference / url /etc. terms in one place, eliminating the need to change many occurrences of the same information in many rows if something changes.
It allows for any number of plural or alternate forms. It will keep record of languages, plus the names of each language in any other language that's in the system (which is very handy if you want to make the program multi-lingual). Also, the descriptive names of all grammatical categories and other metadata can be stored in all available languages.
You can add new categories of meta-information, should the need arise - without changing the table structure. Just add a row in "dataclass" with a descriptive name in the languages that the system uses. The same goes for languages: this model will also allow Quenya to be added - and Sindarin-Quenya translations. Or Italian as another modern language.
Meanwhile, Eryniel is steadily progressing with the tedious job of getting the English glosses for the PE17 (and beyond) Sindarin entries. I hope that we can soon integrate the whole thing!
It's not even that I cannot stop tweaking the thing, but while building prototypes I just hit upon issues that called for these changes. I'm sorry for making it look more complex than needed ...
What made me finally decide to get rid of the explicit TYPE, REF, COMMENT and FUNCTION tables (equivalent to the columns KL, RF, INFO, URL .. in the original table) was that oftentimes there was more than one "piece of information" in one field, e.g. "pa/adj", "num, präf", "arch./poet", "koll.pl.,ling." or "dim., anat." etc. - of course those could go unaltered in the corresponding tables, but well - - it just screams "normalisation!" to me.
To do that, we'll have to be able to accomodate zero-to-many relationships between TRANSLATION and the metadata tables such as TYPE so that one translation instance can have an arbitrary number of TYPE fields.
But then it's better to do it properly for all those metadata, including allowing for category names like "Type", "Ref" and "Comment" to be present in more than one language; and then it's just one more step to throw all metadata in one table, with a separate Type ("dataclass") table.
May I present therefore ... the final datamodel
This will allow maintaining all grammatical / reference / url /etc. terms in one place, eliminating the need to change many occurrences of the same information in many rows if something changes.
It allows for any number of plural or alternate forms. It will keep record of languages, plus the names of each language in any other language that's in the system (which is very handy if you want to make the program multi-lingual). Also, the descriptive names of all grammatical categories and other metadata can be stored in all available languages.
You can add new categories of meta-information, should the need arise - without changing the table structure. Just add a row in "dataclass" with a descriptive name in the languages that the system uses. The same goes for languages: this model will also allow Quenya to be added - and Sindarin-Quenya translations. Or Italian as another modern language.
Meanwhile, Eryniel is steadily progressing with the tedious job of getting the English glosses for the PE17 (and beyond) Sindarin entries. I hope that we can soon integrate the whole thing!
- Eryniel Elmíris
- Posts: 1533
- Joined: Tue Jun 24 2008 19:51
- Location: Ribobel / Rímdor
*claps hands - Applause*Lúthien Meliel wrote:May I present therefore ... the final datamodel
Hmm, soweit mir bekannt ist entspringt der Onodló im Nebelgebirge, dort wo Fangorn beginnt, also im "Land der Ents" wenn man so will. Ich kann mich natürlich irren, aber Sumpfgebiet verbinde ich doch eher mit Flachland, nicht mit Gebirgen. Ausserdem heisst es in HdR: "The waters of the Entwash had special properties. When Merry Brandybuck and Pippin Took bathed their feet in its waters, they felt refreshed and their wounds were healed. The water from the springs of the Entwash was used by the Ents to make Ent-draughts, a drink that caused Merry and Pippin to grow taller." - Da stelle ich mir jetzt nichts besonders Sumpfiges drunter vor....Roman wrote:Der Gwathló 'shaded river from the fen' heißt offenbar so, weil man dachte, er entspringe im Sumpf (UT:263). Ist hier auch anzunehmen, dass der Onodló nach seiner sumpfigen Mündung benannt ist?
Andererseits heisst es: "“Boromir, and any that go with him seeking Minas Tirith, will do well to leave the Great River above Rauros and cross the Entwash before it finds the marshes." Also scheint es so, dass sich der Entwash wohl im Moorland quasi "ergiesst" - und weiter: "The vale of Entwash is flat and fenny, and fog is a deadly peril there for those on foot and laden."
Und das ló von Onodló deutet schon auf eine Art Moor, oder zumindest flachen See hin... Damit wäre der Onodló ein so genanntes "Marschengewässer". Und die werden in Deutschland oft "Tief" genannt (auch wenn es in Mittelerde keine Siele gibt).
EDIT: Vergessen habe ich mal wieder, in PE17 nachzugucken. Damit wäre Romans "Flutwasser" gar nicht so abwegig... Und ein Blick in die deutsche Übersetzung vom HdR gibt: ENTFLUT an.
Ganz interessant: Nach meinen Begriffen könnte der Onodló zu dem Begriff anastomosierender Fluss gezählt werden. Nach seiner Länge, etc. ist es aber eindeutig ein "Fluss", denn eine Ache kennzeichnet ein "deutliches Gefälle" und ein "Strom" würde ins Meer führen. Der Onodló jedoch vereinigt sich mit dem Anduin, was ihn sogar zu einem "Nebenfluss" macht. (Hilft nicht wirklich bei der Übersetzung, ich weiss.)
- Eryniel Elmíris
- Posts: 1533
- Joined: Tue Jun 24 2008 19:51
- Location: Ribobel / Rímdor
Sorry für den Doppelpost, aber ich wollte die zwei Sachen ungern vermischen...
Ein paar Fragen haben sich noch ergeben bezüglich der Wortliste:
- han, es (that). Wäre das nicht "dies" oder "das"?
- ûr, Weite (wide). Das wird als Substantiv deklariert mit Quelle: Ety/396. Dort steht: UR- wide, large, great. Úrion. Q úra large; N ûr wide. das scheint mir eher ein adjektiv zu sein, oder irre ich mich da?
Bezüglich nothlir: Die Stelle in War of the Jewels wie sie mir vorliegt heisst "The Haladin name of people directly descended from Haldar Haleth's brother (by male or female line), a family or 'nothlir' from which the chieftains or Halbars of Brethil were chosen by the Folk." Mag sein, dass ich mich da zu weit aus dem Fenster lehne, aber das scheint mir sich doch eher auf die Familie als tatsächliche Abkommenschaft zu beziehen.
Deine weiteren Ergänzungen, Änderungsn werde ich so gut als möglich einarbeiten.
Da ich PE18 nicht in meinem Besitz habe, wollte ich fragen, ob es möglich ist, dass Du (Roman) noch einmal über die rot markieren Stellen drüber schaust?
Ich würde dir die Excel-Datei, in der ich arbeite dann gerne mailen wollen...
Ein paar Fragen haben sich noch ergeben bezüglich der Wortliste:
- han, es (that). Wäre das nicht "dies" oder "das"?
- ûr, Weite (wide). Das wird als Substantiv deklariert mit Quelle: Ety/396. Dort steht: UR- wide, large, great. Úrion. Q úra large; N ûr wide. das scheint mir eher ein adjektiv zu sein, oder irre ich mich da?
Bezüglich nothlir: Die Stelle in War of the Jewels wie sie mir vorliegt heisst "The Haladin name of people directly descended from Haldar Haleth's brother (by male or female line), a family or 'nothlir' from which the chieftains or Halbars of Brethil were chosen by the Folk." Mag sein, dass ich mich da zu weit aus dem Fenster lehne, aber das scheint mir sich doch eher auf die Familie als tatsächliche Abkommenschaft zu beziehen.
Deine weiteren Ergänzungen, Änderungsn werde ich so gut als möglich einarbeiten.
Da ich PE18 nicht in meinem Besitz habe, wollte ich fragen, ob es möglich ist, dass Du (Roman) noch einmal über die rot markieren Stellen drüber schaust?
Ich würde dir die Excel-Datei, in der ich arbeite dann gerne mailen wollen...
That sounds good, as it may be necessary to extract certain metadata, but not other. For example 'lenited' and 'collective plural' are probably more important than the others and could be displayed in the wordlist itself, not in the detailed entry.You can add new categories of meta-information, should the need arise - without changing the table structure. Just add a row in "dataclass" with a descriptive name in the languages that the system uses. The same goes for languages
Die Frage ist ja, was iôl genau übersetzt - wenn es Entwash ist, dann wäre es "Flutwasser" (es sei denn "Wasch" oder "Waschung" oder so etwas im Deutschen auch irgendwo in geographischen Bezeichnungen verwendet werden). Wenn es aber synonym zu Onodló ist, dann wäre es "Sumpf, Marsch".Und das ló von Onodló deutet schon auf eine Art Moor, oder zumindest flachen See hin... Damit wäre der Onodló ein so genanntes "Marschengewässer". Und die werden in Deutschland oft "Tief" genannt (auch wenn es in Mittelerde keine Siele gibt).
Die Etymologie des Wortes bringt auch nicht wirklich weiter - lô ist von LOG- 'wet (and soft), soaked, swampy'; ähnliích zu -wash wäre wohl Q. nuine 'river (of large volume, and liable to flooding)' von DUY- 'flow strongly, pour (intrans.)'. Iôl scheint aber von YUL- 'drink' zu sein - ich weiß nicht, was man daraus schließen kann.
Ich lasse jetzt jedenfalls "Flutwasser" und füge eine entsprechende Notiz mit ein.
In Noldorin ist ha, hana 'it' und in PE17:42 ist hain 'those, them, the things previously mentioned'. Personal- und Demonstrativpronomen überlappen hier, also: "es, das".- han, es (that). Wäre das nicht "dies" oder "das"?
Das stimmt wohl. Hiswelóke führt aus irgendeinem Grund n. wide auf.- ûr, Weite (wide). Das wird als Substantiv deklariert mit Quelle: Ety/396. Dort steht: UR- wide, large, great. Úrion. Q úra large; N ûr wide. das scheint mir eher ein adjektiv zu sein, oder irre ich mich da?
Das wäre dann WJ:309 - im Englischen also 'family, folk'; im Deutschen "Familie", aber 'folk' lässt sich nicht so richtig übersetzen - "Haus (Abstammung)" (wie bei noss, nost, nothrim) oder veilleicht "Sippe"?Bezüglich nothlir: Die Stelle in War of the Jewels wie sie mir vorliegt heisst "The Haladin name of people directly descended from Haldar Haleth's brother (by male or female line), a family or 'nothlir' from which the chieftains or Halbars of Brethil were chosen by the Folk." Mag sein, dass ich mich da zu weit aus dem Fenster lehne, aber das scheint mir sich doch eher auf die Familie als tatsächliche Abkommenschaft zu beziehen.
Immer her damit.Da ich PE18 nicht in meinem Besitz habe, wollte ich fragen, ob es möglich ist, dass Du (Roman) noch einmal über die rot markieren Stellen drüber schaust?
Ich würde dir die Excel-Datei, in der ich arbeite dann gerne mailen wollen...
- Eryniel Elmíris
- Posts: 1533
- Joined: Tue Jun 24 2008 19:51
- Location: Ribobel / Rímdor
Ok, füge ich noch ein.In Noldorin ist ha, hana 'it' und in PE17:42 ist hain 'those, them, the things previously mentioned'. Personal- und Demonstrativpronomen überlappen hier, also: "es, das".
Dann deklariere ich es bei deiner Liste als adj umDas stimmt wohl. Hiswelóke führt aus irgendeinem Grund n. wide auf.
Ich dachte da eher an engl. parentage, also deutsch Abstammung. Vielleicht ginge so etwas wie: Abstammung (in einer Familie, in einem Clan).Das wäre dann WJ:309 - im Englischen also 'family, folk'; im Deutschen "Familie", aber 'folk' lässt sich nicht so richtig übersetzen - "Haus (Abstammung)" (wie bei noss, nost, nothrim) oder veilleicht "Sippe"?
Danke Kommt per mail.Immer her damit.