Veröffentlicht am Schreib einen Kommentar

SpraXX⁸ Ausgabe 25.4.1 ß

Die Ausgabe steht im WebShop bereit. Die Ausgabe 26.1 wird im Januar erscheinen und den ß-Status verlassen. Bis dahin werden fehlerbereinigte Aktualisierungen (25.4.2 etc.) bereit gestellt.

Die Version L beinhaltet 6700 Einträge mit ca. 23000 Begriffen für Adjektive/Adverbien, Nomen, Verben und Präpositionen. Hinzu kommen ca. 1500 Textbeispiele und Phrasen mit verlinkten Begriffen.

Veröffentlicht am Schreib einen Kommentar

Eigentlich …

… sollte es nur eine Vokabelliste werden.
→ Einen Begriff (DE) mit Übersetzung (EN) in einer Tabelle notieren. Den nächsten Begriff darunter usw.

Was nicht sinnvoll ist,
wenn der EN-Begriff mit Übersetzung (DE) ein anderes Ergebnis liefert.
→ Also alle möglichen Übersetzungen erfassen.

Was nicht sinnvoll ist,
weil eine große Anzahl von Synonymen existiert, deren korrekte Anwendung vom Kontext abhängt.
→ Also den Gültigkeitsbereich mittels einer Begriffsdefinition festlegen.

Was nicht sinnvoll ist,
wenn Begriffe unterschiedlicher Bedeutung nicht getrennt sind.
→ Also Ordnungszahlen¹ etc. zur Kennzeichnung nutzen und in separaten Einträgen erfassen.

Was nicht sinnvoll ist,
wenn Begriff {Synonyme} und Definition in einem Textbeispiel nicht die Tauglichkeit beweisen.
→ Also Textbeispiele erfassen, deren Begriffe in der Vokabelliste existieren und verlinken.

Was nicht sinnvoll ist,
weil einige Begriffe figurativ oder in Phrasen benutzt werden.
→ Also neben den Textbeispielen auch Phrasen erfassen.

Das Ergebnis: eine Vokabelliste, unterteilt nach Wortarten (Adjektive/Adverbien, Nomen, Präpositionen, Verben) sowie Phrasen und Textbeispielen.

Was nicht sinnvoll ist,
ohne die Wechselwirkung (die Wortartverwandtschaft) der Wortarten zu berücksichtigen.
→ Die Substantivierung eines Verbs führt zu einem Nomen, das bedeutungsgleich sein muss.
→ Die Partizipien eines Verbs führen zu Adjektiven, die (theoretisch) bedeutungsgleich sein müssen – aber nicht immer passen!
→ Also die Wortartverwandtschaft zwischen Adjektiven/Adverbien, Nomen und Verben erfassen.

Was sinnvoll ist, aber nicht ausreicht,
weil eine Tabelle zur Erfassung taugt, aber nicht zur Präsentation.
→ Also eine Software entwickeln, die online und offline läuft – im Browser, ohne Installation. Mit einer Volltextsuche. Mit einem Vokabeltrainer zur Überprüfung der korrekten Schreibweise.

Was sinnvoll ist, aber nicht ausreicht,
weil sprachliche Nuancen mit Worten alleine manchmal schwer zu erfassen sind.
→ Also eine Klassifizierung durch Symbole der Begriffe einführen. Die unterscheiden zwischen:
· einer Tätigkeit, einer Handlung, einer Wahrnehmung etc.
· einer Innen- und Außenwirkung.
· einem Zustand und einem Vorgang.
· Flora, Fauna und Mensch.
→ Es sind ziemlich viele Symbole geworden.

Was sinnvoll ist, aber nicht ausreicht,
weil Übersetzungen semantisch gleichbedeutend aber grammatikalisch unterschiedlich sein können. Obwohl DE und EN viele Ähnlichkeiten haben!
→ Also noch mehr Klassensymbole, die Vorgangspassiv, Zustandspassiv und -reflexiv etc. unterscheiden.

Eigentlich …

… sollte es nur eine Vokabelliste werden. Das war 2015. Nach 10 Jahren Arbeit steht das Projekt als ß-Version bereit. Das Ergebnis heißt SpraXX⁸ und ist bezahlbar.

SpraXX⁸ ist umfassend dokumentiert, siehe https://know-how.tolaris.de/doku.php/spraxx/dokumentation/spraxx8. Die Dokumentation ist trotz Struktur nicht leicht verdaulich. Als ich das Projekt begann, war mir nicht klar, wie komplex die deutsche Sprache ist.

Eine Demo von SpraXX⁸ existiert unter https://know-how.tolaris.de/doku.php/spraxx/demo.

Die Ausgabe steht im WebShop bereit. Die Ausgabe 25.4 wird im Oktober erscheinen.

Wolfgang Henderkes

Veröffentlicht am Schreib einen Kommentar

SpraXX⁸ Ausgabe 25.3.2 ß

Die Ausgabe steht im WebShop bereit. Die Ausgabe 25.4 wird im Oktober erscheinen.

Die Version L beinhaltet 6600 Einträge mit ca. 23000 Begriffen für Adjektive/Adverbien, Nomen, Verben und Präpositionen. Hinzu kommen ca. 1500 Textbeispiele und Phrasen mit verlinkten Begriffen.

Die Version m entspricht der L ohne Textbeispiele und Phrasen.

Die Version s verzichtet außerdem auf Antonyme und Definitionen.

Veröffentlicht am Schreib einen Kommentar

Klartext – gegen die Vereinfachung

Frage: wie lässt sich die Fehlinterpretation einer Aussage, einer Dokumentation etc. verringern?

Antwort: mit kurzen Sätzen und einem eindeutigen Wortschatz.

Der Wortschatz umfasst die Begriffe und deren Synonyme. Außerdem unerwünschte Synonyme, falsche Synonyme und Antonyme.

Jedes Ding hat eine (1) Bezeichnung mit einer (1) Schreibweise. Die Synonyme werden erfasst, aber nur in Ausnahmen genutzt.

Kurz: ein Thesaurus ist Pflicht.

Aber nicht genug.

Viele Begriffe sind mehrdeutig. Also ist eine Definition unumgänglich. Ohne Prosa. Kurz und präzise.

Damit existiert eine Grundlage. Es geht nicht um schöne Sätze oder um elegante Sprache. Es geht um (möglichst) widerspruchsfreie Aussagen. Also immer wieder derselbe Begriff für ein Ding. Das gibt dem Leser Sicherheit. Für den Autor ist das eine Zumutung. Jedes Wort muss er mit Bedacht aus dem Thesaurus wählen. Existiert es noch nicht, wird es neu aufgenommen, mit Synonymen etc. wie oben beschrieben.

Alles für den Leser – für den Kunden.

Grundlage der Publikationen von tolaris ist der Thesaurus. Darin ist jedoch nur ein geringer Teil öffentlich sichtbar.

Veröffentlicht am Schreib einen Kommentar

Kopfarbeit statt KI

Eine Wissensgesellschaft braucht ein sprachliches Fundament. Die Verbreitung – allgemein die Nutzung – einer Sprache führt jedoch zur Vereinfachung. Auch die KI ist keine Hilfe – im Gegenteil. KI vergleicht vorliegende Muster ohne Verständnis des Inhalts. Unpräzise Vorlagen führen zu neuen unpräzisen Aussagen und stabilisieren die Vereinfachung. Diese Entwicklung ist auch in Wörterbüchern zu beobachten: das Bestreben möglichst viele Synonyme zu finden führt zur Fehlinterpretation.

Ein Beispiel?
gerechtfertigt ⇔ justified ist NICHT synonym mit {begründet} ⇔ {reasoned} und noch weniger mit {akzeptabel} ⇔ {acceptable}.

Was als gerechtfertigt dargestellt wird, kann evtl. begründet werden – ist es aber ohne Beleg nicht. Ob es akzeptabel ist, liegt im Auge des Betrachters.

Diese Unterscheidung erfordert Kopfarbeit, keine KI. Das Ergebnis heißt SpraXX, einen Einblick vermittelt die Demo.

Veröffentlicht am Schreib einen Kommentar

SpraXX⁸ Ausgabe 25.2.1 ß

Eine aktualisierte Fassung steht im WebShop bereit. Neu hinzugekommen sind ca. 200 Einträge, dementsprechend wurden Links in den Textbeispielen hinzugefügt. Außerdem sind zahlreiche Begriffe nachgeschärft, also präziser abgegrenzt von ähnlichen Begriffen.

Die Version L beinhaltet 6350 Einträge mit ca. 23000 Begriffen für Adjektive/Adverbien, Nomen, Verben und Präpositionen. Hinzu kommen ca. 1500 Textbeispiele und Phrasen mit verlinkten Begriffen.

Die Version m entspricht der L ohne Textbeispiele und Phrasen.

Die Version s verzichtet außerdem auf Antonyme und Definitionen.

Veröffentlicht am Schreib einen Kommentar

Das Spiel mit den Farben

Farben dienen bei tolaris im Text und in den Partituren als Gestaltungsmittel zur besseren Lesbarkeit, zur Betonung und zur Unterscheidung.

Tonarten, Akkorde und Noten sind in einem Goldton gehalten. Im Text sticht ein D5 mehr hervor als ein D♭5. Noch deutlicher ist die Wirkung der Farben in einer Seite des Musik: Lexikon zu sehen. Auch in den Partituren sorgen Farben für mehr Übersicht.

Rock-/Bluesgitarre 1