Forschung zu typografischen Fehlern in Wörterbüchern

1276

Forschung zu typografischen Fehlern in zweiundzwanzig spanischen Fachwörterbüchern (Ariel und Gestión 2000). Ein Überblick

Akademischer und beruflicher Hintergrund

Mein Name ist Santiago Rodríguez-Rubio. Ich lebe in Sevilla (Südspanien). Ich habe einen Bachelor-Abschluss in englischer Philologie, einen dreijährigen Bachelor-Abschluss in Tourismus und einen Master-Abschluss in Übersetzung und Dolmetschen.

Ich arbeite als Englisch-Spanisch, Französisch-Spanisch Übersetzer und Dolmetscher. Meine Fachgebiete sind: Tourismus und Gastronomie, Reisen, Abenteuer, Naturwelt, Finanzen und Buchhaltung, Auto Restaurierung Shows. Ich habe als Übersetzerin und Verbindungsdolmetscherin (sowohl intern als auch freiberuflich) in mehreren spanischen Ingenieurbüros mit Tochtergesellschaften im Ausland gearbeitet. Diese Ingenieurunternehmen sind in folgenden Bereichen tätig: Abwasser- und Trinkwasseraufbereitungsanlagen, Stromerzeugung (Strom, Solarstrom und Windkraft).

Ich war immer sehr an formaler Korrektheit interessiert, sowohl in schriftlicher als auch gesprochener Sprache. Ich nehme an, diese Tendenz kommt von meinem Geschmack zum Lesen, und aus einem mentalen Rahmen, der auf der Zufriedenheit basiert, die Sie von der gut gemachten Arbeit bekommen.

Meine Recherche zu typografischen Fehlern in spezialisierten zweisprachigen Wörterbüchern (Materialien)

Seit 2016 recherchiere ich in einem Korpus von zweiundzwanzig spanischen Fachwörterbüchern für zweisprachige Papiere zu typografischen Fehlern. Der Korpus ist rund 15.000 Seiten lang, und die Werke sind hauptsächlich bidirektional Englisch-Spanisch. Die Wörterbücher wurden von zwei spanischen Verlagen der Mediengruppe „Grupo Planeta“ veröffentlicht, nämlich „Ariel“ und „Gestión 2000“.

Die Wörterbücher wurden nach ihrem akademischen Status und dem Prestige des Verlegers ausgewählt. Vierzehn dieser zweiundzwanzig Werke entsprechen den so genannten „“Alicante Wörterbücher„(Mateo 2018, in Fuertes-Olivera, Das Routledge Handbuch der Lexikographie), einschließlich Arbeiten zu internationalen Handel, internationale Besteuerung, Banken, Versicherungen, Aktienmarkt, Werbung und Marketing, Tourismus, Schuhindustrie, etc. Diese vierzehn Wörterbücher wurden von Ariel veröffentlicht. Sie sind mit der IPA-Forschungsgruppe „Professional and Academic English“ von der Universität Alicante sowie mit der IULMA („Institute of Applied Modern Languages“) aus der Gemeinschaft Valencia (Ostspanien) verbunden. Einige dieser vierzehn Wörterbücher sind Wahrzeichen in der spanischen spezialisierten zweisprachigen P-Lexikographie und Englisch für spezifische Zwecke Wissenschaft. Die ersten beiden Wörterbücher der Alicante-Serie waren Diccionario de Términos Jurídicos/A Wörterbuch der Rechtsbegriffe (Alcaraz und Hughes, 1993) und Diccionario de Términos Económicos, Financieros y Comerciales/Ein Wörterbuch wirtschaftlicher, finanzieller und kommerzieller Begriffe (Alcaraz und Hughes, 1996). Diese beiden Werke wurden zuletzt 2012 überarbeitet und 2014 neu gedruckt.

Herkunft und Entwicklung meiner Forschung

Meine Forschung entstand durch Zufall. In meiner Übersetzungsarbeit habe ich die oben genannten zwei Wörterbücher regelmäßig verwendet (und weiter verwendet). Es dauerte nicht lange, bis ich anfing, verschiedene typografische Fehler zu erkennen. Zuerst dachte ich, dass es sich um nur ein paar gelegentliche Fehler handeln würde, aber sehr bald bemerkte ich, dass es eine Art „Modell von Fehlern“ gab, da Fehler in allen Positionen des Textes (Lemma, Definition, Illustration, Querverweise, Seitenanfang usw.) allgegenwärtig auftraten und einige Fehler an verschiedenen Stellen innerhalb desselben Abschnitts oder in einem anderen Abschnitt der Arbeiten wiederholt wurden. Als meine Forschung fortschritt, stellte ich fest, dass nicht nur einige Fehler wiederholt wurden, sondern auch, dass einige von ihnen in ähnlichen Sätzen oder sogar in den gleichen Sätzen wiederholt wurden. Ich habe auch festgestellt, dass einige Fehler nicht nur im Kontext eines bestimmten Wörterbuchs wiederholt wurden, sondern auch in verschiedenen Werken. Zum Beispiel erschien ein bestimmter falsch getippter Begriff (Varianten nicht enthalten) elf Mal in drei verschiedenen Wörterbüchern. Ein anderer falsch getippter Begriff (Varianten nicht enthalten) erschien sechzehn Mal in drei verschiedenen Wörterbüchern. Ein fehlgeschriebener Begriff wie Unterkunft (oder die Varianten Unterkünfte, Acommodation, Unterkunft, Unterkunft) erschien mehr als vierzig Mal in acht verschiedenen Wörterbüchern.

Der Korpus von zweiundzwanzig Wörterbüchern wurde Seite für Seite vollständig auf homogene Weise analysiert, d. h. unter Verwendung der gleichen Fehlererkennungskriterien. Neben den Körpern („Englisch-Spanisch“/„Spanisch-Englisch“) wurde auch der Rest der Hyperstruktur der Arbeiten analysiert (d. h. Deckblätter, Vorworte, Einführungen usw.). Angesichts der Länge des Korpus wurden verschiedene Unterkorpora für Analyse- und Vergleichszwecke festgelegt. Genauer gesagt erlaubte die Einrichtung von Unterkorpora oder Untergruppen von Wörterbüchern, Mechanismen abzubilden, durch die Fehler in verwandten Werken wiederholt oder reproduziert wurden. Verwandte Wörterbücher wurden nach verschiedenen Kriterien erstellt: Werke mit denselben Autoren, Werken, die zu denselben Studienrichtungen gehören, oder Werke, die derselben redaktionellen Untersammlung angehören (z. B. Wörterbuch der Begriffe des Natursteins und der alliierten Industrie und die Wörterbuch der Begriffe der Schuhe und der alliierten Industrie bilden Sie die Serie „Wörterbücher der Industriebedingungen“ von Ariel, und daher entsprechen sie einem relevanten Unterkorpus).

Typografische Fehler wurden in Kategorien und Unterkategorien wie „Nichtwortfehler“ (Buchstabenauslass, Einfügung, Substitution oder Umsetzung) und „Echtwortfehler“ (Wortauslass, Einfügung, Substitution oder Umsetzung) eingereiht. Innerhalb jeder Kategorie oder Unterkategorie wurden Fehler nach Wiederholungs- oder Ähnlichkeitskriterien gruppiert. Dies ermöglichte es uns, die intratextuelle Fehlerwiederholrate für jedes Wörterbuch zu ermitteln, aus dem eine Reihe relevanter Schlussfolgerungen gezogen wurden.

Grob gesagt, wurden zwei Arten von ähnlichen Fehlern unterschieden.Auf der einen Seite ähnliche Fehler mit dem gleichen zugrunde liegenden Begriff (z. Terapeutik, therapeutisch, therpeutisch, therapeutisch oder Spektroophometer, Spektophotometrie).Auf der anderen Seite ähnliche Fehler mit unterschiedlichen zugrunde liegenden Begriffen (z. objetiv, subjetiv).Im letzteren Fall gibt es eine Beziehung der Antonymie zwischen den beteiligten Begriffen, aber andere falsch getippte Begriffe weisen andere Beziehungen auf, wie beispielsweise die Wortstruktur (z. Begleitung, Etablihment oder Markmanship, Wächtershp, Zensorhip, Sponshorship), oder die Tatsache, dass sie zu demselben semantischen Feld gehören (z. Terminierung, Liquidation, Erschöpfung).

Einer der schockierendsten Real-Wort-Fehler sind diejenigen, die zur Ersetzung eines Wortes durch ein anderes Wort führen. Zwei Arten von Wortersetzungen wurden in meiner Forschung beschrieben:intralinguale Substitution (z. Gastronomie für Gastrostomie) und interlinguale Substitution (z. als Körnung spenden für Dispens wie geschrieben). Einige dieser Substitutionsfehler sind wahrscheinlich automatisch generiert worden. In der Tat können die von mir zusammengestellten Daten eine Anwendung im Bereich des maschinellen Lernens für Rechtschreibprüfer haben, da letztere aus dem erkannten Fehlersatz lernen könnten, sofern die korrekten Begriffe auch in der gleichen Weise wie in einem parallelen Korpus eingegeben werden.

[expander_maker id=“1„mehr=„Lesen Sie mehr“ weniger= „Lesen Sie weniger“]

Es lohnt sich, Fehlerfolgen aus qualitativer Sicht zu erwähnen. Manchmal wurden mehrere Fehler in einem bestimmten Satz oder in einem bestimmten Eintrag gefunden. Zum Beispiel im Eintrag „“Hypnose (... es una estado ähnlich al sueño... inducida... en el que pueden surgir... alucionaciones... eine breite Palette von Optionen von Aspirin Hypnosys)“, wurden vier Fehler festgestellt: zwei Beispiele für geschlechtsspezifische Meinungsverschiedenheiten („Una Estado... inducida„für „un estado... inducido“), ein Einfügungsfehler, der wahrscheinlich durch psychomotorische Antizipation des Segments „cio“ verursacht wird („alu“).CIOna, ichCIONES für „alucinaciones“) und ein Substitutionsfehler, der wahrscheinlich durch psychomotorische Beharrlichkeit des Buchstabens „y“ verursacht wird (hYPNosYS für Hypnose).

Interlinguale Interferenz ist ein weiterer psycholinguistischer Aspekt der kompilierten Fehler, die in Zukunft untersucht werden könnten. Ein fehlgeschriebener Begriff wie initiativ (für Initiativen) hätte durch die Einmischung des spanischen Gegenstücks „iniciativas“ entstehen können. In ähnlicher Weise, Infektionen (für Infektionen) hätte von „Infecciones“ abgeleitet werden können, unwiderstehlich (für Instabilität) aus „inestabilidad“, Zerbrechlichkeit und zerbrechlich (für Düfte und duftend) aus „fragancia“ und „fragante“ und so weiter.

Follow-up. Kommunikation mit dem Verlag und den Autoren der Wörterbücher

Ich möchte klarstellen, dass es keine berufliche oder akademische Beziehung zwischen den Verlagen oder den Autoren und mir gibt. Ich forschte im Rahmen eines Doktoratsstudiums an der Pablo de Olavide Universität (Sevilla, Spanien). In jedem Fall kontaktierte ich den Chefredakteur von Ariel und den Direktor von IULMA sowie die Autoren. Ich gab ihnen alle gründliche informationen über meine recherche und natürlich bot ich meine zusammenarbeit an, um die fehler in ihren wörterbüchern zu korrigieren.

Ich würde empfehlen, die relevanteren Wörterbücher in der Studie zu korrigieren. „Null-Fehler“ ist in solch komplexen Werken einfach unerreichbar. Jeder Lexikograph würde es Ihnen sagen. Es ist auch eine Frage des gesunden Menschenverstandes. Dennoch sollte ein Referenzwerk ein sehr hohes Maß an Korrektheit aufweisen. Außerdem fand ich nicht nur eine bloße Anhäufung von Fehlern, sondern etwas, das ich als „Modell“ oder „Paradigma“ von Fehlern bezeichnet habe. In Ein Terminologie-Wörterbuch der Pharmazeutischen Wissenschaften (Domínguez-Gil, Alcaraz und Martínez, 2007), fand ich (unter vielen anderen Fehlern, die zu anderen Kategorien gehören, die ebenfalls registriert wurden) fast siebenhundert Nicht-Wort-Fehler und Real-Wort-Fehler; mit anderen Worten, ein Fehler, der zu einer dieser Unterkategorien gehört, alle 1,58 Seiten. Jetzt würde ein Fehler alle 1,58 Seiten in einem Text 1,5 Seiten lang nur einen Fehler bedeuten; die gleiche Fehlerhäufigkeit in einer Arbeit mit einer Länge von 1.000 Seiten (wie das betreffende Wörterbuch) zeigt jedoch eine Art „Fehlerkonsistenz“.

Siehe Details zu den Fehlern, die in Ein Terminologie-Wörterbuch der Pharmazeutischen Wissenschaften in meinem Beitrag „Eine quantitative Analyse von typografischen Fehlern in Ein Terminologisches Wörterbuch der Pharmawissenschaften, Englisch-Spanisch/Español-Inglés (Ariel, 2007)“, veröffentlicht in Panace@, 2018:

http://www.tremedica.org/panacea/IndiceGeneral/n47-analisis.pdf

Im Korpus von zweiundzwanzig Wörterbüchern fand ich (unter vielen anderen Fehlern, die auch registriert wurden), mehr als 4.000 Nicht-Wort-Fehler und Real-Word-Fehler, einschließlich einer Vielzahl von grammatikalischen Fehlern (z. B. geschlechtsspezifische Meinungsverschiedenheiten, Zahlenunstimmigkeiten, falsche Verbformung usw.). Siehe Titel und Jahr der Veröffentlichung dieser zweiundzwanzig Werke im Anhang zu meiner Arbeit.

Schlussfolgerungen

„Die Alicante Wörterbücher‚bilden eine relevante Sammlung von spezialisierten zweisprachigen Papierwörterbüchern, nicht nur in Spanien, sondern auch auf internationaler Ebene (siehe „Die Alicante Wörterbücher„, in Fuertes-Olivera 2018, Das Routledge Handbuch der Lexikographie). Auf der Grundlage unserer Feststellungen hinsichtlich der Fehlerhäufigkeit und der Fehlerwiederholquote würden wir empfehlen, die prominenteren Arbeiten des Korpus zu revidieren, einschließlich Ein Terminologie-Wörterbuch der Pharmazeutischen Wissenschaften (Ariel, 2007).

Unsere Forschung ist beispiellos und wir glauben, dass sie einen klaren Mehrwert bietet. Es könnte definitiv dazu beitragen, das Wissen über typografische Fehler in Wörterbüchern aus einer zweifachen Perspektive zu erweitern: Fehlergenerierung und Fehlererkennung/Korrektur. Genauer gesagt werden wertvolle Einblicke in Mechanismen der Wiederholung oder Reproduktion von Fehlern in verwandten Wörterbüchern angeboten.

Wie bereits erwähnt, konnten unsere Daten auch auf Natural Language Processing (NLP) angewendet werden, genauer gesagt auf den Bereich des maschinellen Lernens für Rechtschreibprüfer.

[/expander_maker]


Geschrieben von Santiago RodrĂ­guez-Rubio, Ăśbersetzer (Spanien)