Überarbeitung der Wortliste

Moderator: Moderatoren

Benutzeravatar
Lúthien Meliel
Beiträge: 79
Registriert: Do Jun 26 2008 21:58
Kontaktdaten:

Beitrag von Lúthien Meliel » Fr Sep 30 2011 12:28

Here's a little example database with only three Sindarin entries, should anyone like to have a look at it. It's an SQLite database, which is the lightest open source database that I could find (see http://www.sqlite.org/ if you want to know more about it). It also has a very small memory footprint, and therefore is probably also very fast in performance.

All the data and structures are maintained in only one file, which I uploaded on http://parendili.org/doc/ithildin.db. Note that you will need some sort of SQLite interface in order to access it: you can use the command line tool supplied by sqlite.org or another one (there's a few out there, some also free). I found that the firefox plugin is very handy: it provides a graphical user interface so that you can browse through the data.
(if you just want the sql to re-create all tables, I uploaded that here: http://parendili.org/doc/ithildin.db.dump )

In order to demonstrate how the model works, here's a query that retrieves the entries, plus the metadata that I entered (it's only very basic, because I added these by hand):

select l.name, e1.gloss, e2.gloss, dc.name, md.text from entry e1
join translation t
on e1.id = t.sind_entry_id
join entry e2
on e2.id = t.mod_entry_id
join tr_md trmd
on trmd.translation_id = t.id
join metadata md
on md.metadata_id = trmd.metadata_id
join dataclass dc
on dc.dataclass_id = md.dataclass_id
join language l
on l.lang_id = md.language_id
and l.lang_id = e2.language_id
and l.lang_id = dc.language_id
and l.lang_id = l.desc_lang_id

this gives the following result:

Bild

if you would restrict the query to one language only, say "German", you can add the clause " where l.name = 'Deutsch' ":

Bild

or if you want to only retrieve the short names for the metadata, you can replace this part

select (...) dc.name, md.text from (...)
with this
select (...) dc.short_name, md.short_text from (...)

Bild

Just to make sure .. it's not necessary to deal with any of this technical stuff in order to use it. It's just to illustrate how it works.

Bild

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Sa Okt 01 2011 21:32

I'm finished going through the list of words in Hiswelóke which were not on sindarin.de. It was a good idea to make such a list, as it revealed lots of issues.. It seems to me that there will never be the ultimate dictionary, one can get used to the thought of a state of perpetual revisions...
Anyway, here is a log of changes. I'll have a look at your tables when I've got the time.

- *rim
+ ambath (amath)
brethel, pl. brethil Ety/376 und brethil Ety/352 getrennt
+ cadwar (cadwor), pl. *cedwoer
+ deloth (delos)
+ dúwath (dúath)
+ egthel (ecthel)
**eiliant -> eilianw, eilian
+ emmelin (emlin)
+ enegui + Kommentar
ened und enedh getrennt
+ pl. feles (falas)
+ gemb (gem)
+ glamb (glam)
+ glas (*glass)
+ gœlœidh, geleidh (golodh)
+ golodhvir (golovir)
hathel, hathol getrennt
+ heledirn (heledir)
+ hervenn (herven)
+ hervess (herves)
+ mesg (mesc)
minnas, minas getrennt
+ pl. muindyr (muindor)
+ pl. newaig X/EI (nawag)
+ nœdia- (nedia-)
+ nemb (nem)
+ old (oll)
+ pl. eirch, erch (orch)
+ orchall (orchal) + Kommentar
+ pl. ereid (orod)
+ graug
+ pl. seleb (salab)
+ ahamar
+ Daumenpaar (samarad)
+ tadeg + Kommentar
+ neleg + Kommentar
+ teilia- (telia-)
+ teilien (telien)
+ ters (tess)
+ thamb (tham)
+ thambas (thamas)
tolodh und toloth getrennt
+ yneb
+ inib

Also:

+ ravaed
+ pirin

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » So Okt 02 2011 0:39

It seems to me that there will never be the ultimate dictionary, one can get used to the thought of a state of perpetual revisions...
I think with anything Tolkien, that's quite normal though... but I would like to think once we have a fixed starting point - one that I think we are approaching now - we will have a usable Dictionary that will need updating "only" when new information is published...
I'm finished going through the list of words in Hiswelóke which were not on sindarin.de.
So how do you suggest we continue?
The following words are still not in the list (just copy-pasted). Does that mean you would like them not to be?

- erin S. [ɛrin] präp. an dem — on the ◇ SD/129-31
- galad dawn (PE17:84)
- †godref *S. (godrebh N.) [gˈɔdrɛv] (godrebh N.) adv. zusammen hindurch — through together ◇ TAI/150
- gwân (gwan) fair, pale (PE17:165)
- ho N. [hɔ] (hon N., hono N.) pl. †hyn *S. [hyn] (huin N.) pron. 3. pers. m. er — he ◇ Ety/385, X/Z
- -iann, -ion, -iand wide (PE17:115)
- ithildim moon-star(-light) (PE17:39)
- †land I *S. [lˈɑnd] (lhand N.) adj. Fläche — open space, level ◇ Ety/368, X/LH, X/ND1
- meiniel female (PE17:190)
- mēnē, emēnē- have as object, (in)tend, proceed, make for, go towards (PE17:93)
- mîn II S. [mˈiːn] (min- S.) präp. zwischen (konkret örtlich zu verstehen) — (in) between (referring to a gap, space, barrier or anything intervening between two other things)
- minlamad S. [minlˈɑmɑd] s. Ling. (?) alliteratives Versmas (minlamad thent/estent) — 'first voiced' or 'first-echoing', alliterative (?) verse mode (minlamad thent/estent)
- naglath N. [nˈɑglɑθ] s. koll. von nagol, Biol. die Zähne — the teeth ◇ WR/122
- nuin S., N. [nujn] präp. unter dem/den — under the ◇ Ety/378
- rhúnedain East men (PE17:18 )
- taur wise (PE17:102)
- thôr II N. [θˈɔːr] adj. Hinunterspringen, Hinunterstürzen, Sturzflug — swooping, leaping down ◇ Ety/393
- thórod N. [θˈɔːrɔd] s. Sturzbach — torrent ◇ Ety/393
- uin S. [ujn] präp. von — of the ◇ SD/129-31
- whaewar breeze (PE17:34)
- whinn birch (PE17:23)

And what about the more general gloss of 'lore-master' for golodh, (PE17:139)?

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » So Okt 02 2011 10:37

- galad dawn (PE17:84)
That's Early Noldorin. Ignote the comments in the brackets in PE17 - they just compare the words with other sources.
- †godref *S. (godrebh N.) [gˈɔdrɛv] (godrebh N.) adv. zusammen hindurch — through together ◇ TAI/150
The word is too uncertain. I still suspect it's actually a verb.
- ho N. [hɔ] (hon N., hono N.) pl. †hyn *S. [hyn] (huin N.) pron. 3. pers. m. er — he ◇ Ety/385, X/Z
Pronouns with gender distinction seem to have been rejected after the LotR.
- -iann, -ion, -iand wide (PE17:115)
Mhm, well - suffixes were not in the dictionary before.
- meiniel female (PE17:190)
It doesn't mean 'female', it's rather the female version of the name Manwe.
- mēnē, emēnē- have as object, (in)tend, proceed, make for, go towards (PE17:93)
This is Common Eldarin or very, very old Sindarin.
- thôr II N. [θˈɔːr] adj. Hinunterspringen, Hinunterstürzen, Sturzflug — swooping, leaping down ◇ Ety/393
- thórod N. [θˈɔːrɔd] s. Sturzbach — torrent ◇ Ety/393
These seem to be Ilkorin.
- whinn birch (PE17:23)
Appears already as hwinn.
And what about the more general gloss of 'lore-master' for golodh, (PE17:139)?
Appears as "Lehrmeister", unless there is a better way to translate it...
- gwân (gwan) fair, pale (PE17:165)
- ithildim moon-star(-light) (PE17:39)
- †land I *S. [lˈɑnd] (lhand N.) adj. Fläche — open space, level ◇ Ety/368, X/LH, X/ND1
- minlamad S. [minlˈɑmɑd] s. Ling. (?) alliteratives Versmas (minlamad thent/estent) — 'first voiced' or 'first-echoing', alliterative (?) verse mode (minlamad thent/estent)
- naglath N. [nˈɑglɑθ] s. koll. von nagol, Biol. die Zähne — the teeth ◇ WR/122
- rhúnedain East men (PE17:18 )
- whaewar breeze (PE17:34)
These should be added.
- taur wise (PE17:102)
Daur - or am I overlooking something?
- erin S. [ɛrin] präp. an dem — on the ◇ SD/129-31
- mîn II S. [mˈiːn] (min- S.) präp. zwischen (konkret örtlich zu verstehen) — (in) between (referring to a gap, space, barrier or anything intervening between two other things)
- nuin S., N. [nujn] präp. unter dem/den — under the ◇ Ety/378
- uin S. [ujn] präp. von — of the ◇ SD/129-31
I'm not sure about compounded prepositions, as they're somehow on the border between grammar and vocabulary. But I guess it wouldn't hurt to add them.
So how do you suggest we continue?
You mention a 'second sheet' in your mail, but I don't think I got any second sheet. If they words above are all which it contained, then I'll make the changes in the table and send it once more to you.

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Mo Okt 03 2011 1:44

Thank you for those clarifications Roman :)
You mention a 'second sheet' in your mail, but I don't think I got any second sheet.
Thats strange, it should have automatically been in the excel sheet...
If they words above are all which it contained, then I'll make the changes in the table and send it once more to you.
Yes, thats all there was in that sheet, so thanks :)
I'm not sure about compounded prepositions, as they're somehow on the border between grammar and vocabulary. But I guess it wouldn't hurt to add them.
Yes, I think they might be handy to have in a dictionary.

The mentioned PE17 were from a list I got from here before I actually got PE17 itself. I was trying to mention everything rather than make my own judgements.
I also got the second file, so I will make the last changes and then off with it to Lúthien. Menneg hennaid :)

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Fr Okt 07 2011 0:22

So, nachdem die Liste nun bei Lúthien ist, wollte ich einen Vorschlag von Roman nochmals aufgreifen und in die Runde fragen, wie die Meinungen dazu sind:
Roman hat geschrieben:It should be very helpful, however, to include the past tenses for all verbs - reconstructed, if needed - as they aren't trivial in Sindarin, and also indicative of a verb's etymology - which does belong into a helpful dictionary.
Ich persönlich bin total dafür, würde aber gerne eure Meinungen hören.

Benutzeravatar
Eirien
Moderator
Beiträge: 2091
Registriert: Do Mär 15 2007 13:23

Beitrag von Eirien » Di Okt 11 2011 11:27

Ich bin mir nicht ganz sicher, ob ich die Frage richtig verstehe: Wenn es sich darum handelt, dass wir uns einfach etwas Nützliches + Sinnvolles wünschen dürfen, wird doch bestimmt niemand Nein sagen?
Falls die Frage irgendwelche Mithilfe/Schreibarbeit o.ä. betrifft, würde ich natürlich auch dazu Ja sagen, im Rahmen meiner Möglichkeiten.

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Mi Okt 12 2011 0:55

Danke Eirien, ich dachte schon, das interessiert niemanden....

Gemeint war, ob die Aufführung der Vergangenheitsform für Verben in der Übersetzungs-Applikation gewünscht ist oder nicht.
Und wegen Mitarbeit: Wenn es soweit ist, werden bestimmt alle gebraucht ;)

Benutzeravatar
Avorninnas
Beiträge: 1498
Registriert: Mo Mär 12 2007 22:58

Beitrag von Avorninnas » Mi Okt 12 2011 7:40

Eirien hat geschrieben: Falls die Frage irgendwelche Mithilfe/Schreibarbeit o.ä. betrifft, würde ich natürlich auch dazu Ja sagen, im Rahmen meiner Möglichkeiten.
Ich ebenfalls - ich dachte, das sei in unserem Rahmen hier ohnehin selbstverständlich.

Faerphin
Beiträge: 59
Registriert: So Jul 04 2010 13:45

Beitrag von Faerphin » Mi Okt 12 2011 8:31

Mir würde das auch gefallen. Außerordentlich. :pro:


Und da hier schon die Rede von einer Anwendung ist würde ich gerne etwas vorschlagen, was ich in der Darstellung der Suchergebnisse sehr hilfreich fände. Wenn man ein Wort nachschlägt zeigt die Webseite alle Sindarinworte an, die unter anderem auch die gefragte Bedeutung haben. Für jedes einzelne Ergebnis bedeutet das, daß man nur einen Ausschnitt des Bedeutungsumfangs sieht - was mitunter irreführend ist. Und wenn mehrere Möglichkeiten angeboten werden, kann man nur raten welches der Worte gerade angebracht wäre zu verwenden. Um eine gute Entscheidung treffen zu können muß ich deshalb oft noch eine Suche für jedes gefundene Sindarinwort anschließen, um alle Übersetzungsmöglichkeiten zu erfahren - was unnötig umständlich ist.

Ideal fände ich es daher, wenn eine Suche nicht nur die möglichen Worte ergäbe, sondern für jedes auch die möglichst klare Bedeutung darstellen würde. Deshalb wäre mein Vorschlag:
- In der Spalte "Deutsch" alle Übersetzungen aufzuführen (den eingetippten Suchbegriff hervorheben)
- Eine Spalte "original gloss" ausgeben.

Ailinel
Beiträge: 1715
Registriert: Fr Mär 16 2007 11:53

Beitrag von Ailinel » Mi Okt 12 2011 15:32

Eryniel Elmíris hat geschrieben:So, nachdem die Liste nun bei Lúthien ist, wollte ich einen Vorschlag von Roman [*bzgl. der Aufnahme der past tenses] nochmals aufgreifen und in die Runde fragen, wie die Meinungen dazu sind
Ich habe deshalb nicht sofort geantwortet, weil ich diesbezüglich etwas im Zweifel war/bin. Es käme damit m.E. ein massives hypothetisches Element zu dem ansonsten fast gänzlich auf attestiertem Material beruhenden (mit exakten und hohen Ansprüchen genügenden Quellenangaben ausgestatteten) Vokabular hinzu, von Regularisierungen, die ja erklärt werden und leicht nachvollziehbar sind, einmal abgesehen. Rekonstruierte Vergangenheitsformen scheinen mir teilweise einer grundsätzlich anderen Kategorie des Spekulativen, Hypothetischen anzugehören und sollten möglicherweise eher in einer Zusammenfassung der Grammatik, aus der Sicht eines konkreten, identifizierbaren Autors, dargestellt werden.
Ich sehe und respektiere aber andererseits, dass manche die Aufnahme solcher Formen hier nützlich finden, und möchte mich daher der Stimme enthalten.

Benutzeravatar
Roman
Admin
Beiträge: 2016
Registriert: Di Mär 13 2007 13:27
Kontaktdaten:

Beitrag von Roman » Mi Okt 12 2011 20:27

Ideal fände ich es daher, wenn eine Suche nicht nur die möglichen Worte ergäbe, sondern für jedes auch die möglichst klare Bedeutung darstellen würde. Deshalb wäre mein Vorschlag:
- In der Spalte "Deutsch" alle Übersetzungen aufzuführen (den eingetippten Suchbegriff hervorheben)
Also einfach entsprechende Zeilen aus der Sindarin-Deutsch-Wortliste ausgeben (wie jetzt in html), mit dem hervorgehobenen Suchbegriff? Das klingt eigentlich ganz vernünftig.
Ich muss die Suche sowieso an Lúthiens neues Datenformat anpassen und werde es mal probieren.
- Eine Spalte "original gloss" ausgeben.
Das war bislang nicht möglich, aber mit Lúthiens Daten wird es hoffentlich eine triviale Hinzufügung sein.
Ich habe deshalb nicht sofort geantwortet, weil ich diesbezüglich etwas im Zweifel war/bin. Es käme damit m.E. ein massives hypothetisches Element zu dem ansonsten fast gänzlich auf attestiertem Material beruhenden (mit exakten und hohen Ansprüchen genügenden Quellenangaben ausgestatteten) Vokabular hinzu, von Regularisierungen, die ja erklärt werden und leicht nachvollziehbar sind, einmal abgesehen. Rekonstruierte Vergangenheitsformen scheinen mir teilweise einer grundsätzlich anderen Kategorie des Spekulativen, Hypothetischen anzugehören und sollten möglicherweise eher in einer Zusammenfassung der Grammatik, aus der Sicht eines konkreten, identifizierbaren Autors, dargestellt werden.
Ich sehe und respektiere aber andererseits, dass manche die Aufnahme solcher Formen hier nützlich finden, und möchte mich daher der Stimme enthalten.
Mir gefällt es eigentlich auch nicht, zu viele Spekulationen in die Wortlisten aufzunehmen, da man sich damit auch nur Arbeit macht, wenn mit einer neuen Publikation alles wieder geändert werden muss. Ich habe z.B. sehr viele rekonstruierte Plural-Formen aus den Listen gelöscht, weil die Pluralbildung nach vorgegebenen Regeln aus der Wortstruktur ableitbar ist, die jeder anwenden kann, der die Grammatik liest. Die Lautänderungen sind hier diachronisch, der Satz von Regeln aber synchronisch. Eigentlich ist es mittlerweile auch überflüssig, rekonstruierte Plurale für den magol/cabor-Typ zu führen, da hier die Pluralbildung nunmehr anhand der Alternativformen magl/cabr (oder deren Abwesenheit) ableitbar ist.
Bei Verbvergangenheiten ist die Sache aber weniger trivial, weil hier individuelle Lautveränderungen zum Tragen kommen, die schwer synchronisch zu erklären sind. Ich glaube aber nicht, dass die Vergangenheiten hier eine andere Klasse des Hypothetischen bilden. Den zum jetzigen Zeitpunkt attestierten Beispielen nach zu urteilen, scheint die Art der Bildung doch recht vorhersagbar zu sein (im Gegensatz zu Quenya), es sind eben nur die diachronischen Änderungen, die das ganze bis zur Unkenntlichkeit verstümmeln.

Da das Projekt jetzt nun allem Anschein nach Hiswelóke ablösen wird, brauchen wir unbedingt noch etwas: Das Anführen der nicht-regularisierten Formen. Ich denke aber, das sollte sich nicht als sehr schwierig gestalten - man braucht bloß eine Spalte anzufügen und alle mit X/Reg. markierten Wörter durchzugehen (es sind 339). Dann kommen da aber auch noch die Noldorin-Vergangenheitsformen dazu.

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Sa Okt 15 2011 22:59

Keine Panik, das Gute hieran ist ja, dass es in Java passieren wird, was plattformunabhängig ist (es läuft auf Windows, Linux und Mac). Des weiteren ist es ja ein "Projekt in Arbeit" und es sollte kein Problem sein, weitere Dinge hinzuzufügen. Es muss also nicht alles auf einmal hinein.
Ich habe Lúthien auf diese neuen Aspekte aufmerksam gemacht. Sie arbeitet zur Zeit an der Ausgabe (Display), da es einige neue Dinge in Java gibt, die sie gerne nutzen möchte und sie außerdem in Ihrer Arbeit gerade ziemlich eingebunden ist.
Ich finde es sehr gut, dass darüber geredet und gemeinsam entschieden wird. Ich denke, so kommt das Bestmögliche dabei heraus.

Benutzeravatar
Lúthien Meliel
Beiträge: 79
Registriert: Do Jun 26 2008 21:58
Kontaktdaten:

Beitrag von Lúthien Meliel » So Okt 16 2011 19:47

Update:

last week I got the updated wordlist from Eryniel and I've started to consolidate everything into the db schema. That's a bit of a puzzle job but it is going pretty well. I'll post the sqlite db file somewhere if that's done, so anyone interested can have a look at it.

I'm not sure I completely understand the issues that you speak of above - my German is quite ok, but in technical discussions it still lacks a bit :)
But if I get the gist of it right: the fact that the application is built in Java is irrelevant for the contents of the dictionary. It's merely handy in order to have it available for any platform.

What I tried to do is to model the database in such a way that adding data (e.g. adding other modern languages or another elvish one), or adding new categories of metadata (e.g. adding past tenses) will not require a change in the database structure, but only a change in the contents of it so that the application itself does not have to be altered in order to accomodate that.

Benutzeravatar
Eryniel Elmíris
Beiträge: 1520
Registriert: Di Jun 24 2008 19:51
Wohnort: Ribobel / Rímdor

Beitrag von Eryniel Elmíris » Mo Okt 17 2011 1:22

Let me try to summarize what we are talking about in German:

- the question if there should be a past tense included in the sindarin verbs is still under discussion. On one hand it would be very handy since the reconstruction of unknown past tense words is not really transparent, on the other hand exactly those reconstructions would leave the attested path, going onto speculations.
- the other suggestion was to display not only the sindarin word if you search for a translation in german, but also all possible translation alternatives. For example: you enter Ruhm" as search word and would get something like: aglar - Glanz, Ruhm (sources)...
- then there was the suggestion to always show the original gloss (which as I understand wouldn't be necessary if your search language is english.
- And last but not least Roman wished to include the non-regularized forms where applicable, but if we would do that, then the Noldorin past-tense should also be included.

Antworten