Inventarisatie van taal industriële terminologie

taal industriële terminologie

Taalindustrie taalprofessional, taal beroep, taal werk. Vier eenvoudige termen. Iedereen begrijpt wat ze bedoelen, maar hoe zeg je 'taalprofessional' in het Frans? Of 'taalindustrie' in het Nederlands?

Liesbet Van Oudenhove uiteengezet voor postuur zulks uiterlijk tijdens haar stage bij De Taalsector. Ze verzamelde taal branchegerichte terminologie en zocht naar een plek om te delen van de voorwaarden en bespreek ze met de "Gemeenschap van belang". De taalindustrie is levend en veranderende: in feite, het volstaat te zeggen dat terminologie positief is swingen! Dit is het verslag van haar avontuur.

Liesbet Van Oudenhove, Gent-eerst en vooral, bezocht ik de website van De Taalsector voor een algemeen idee van de belangrijkste terminologie in de taalindustrie. Onmiddellijk vond ik een interessante termijn volgens de basislijn van De Taalsector: iets in de trant van 'taalprofessional' als letterlijk vertaald in het Engels, maar, precies aan wie of wat de term 'taalprofessional' verwijst? En hoe vertaalt u deze term in het Frans, bijvoorbeeld?

"Taalprofessional" verwijst naar iedereen die zich bezighouden met professionele taal werk: tekstschrijvers, taalleraren, tolken, taal ingenieurs, technische schrijvers, editors, geletterdheid leerkrachten, taal beleid coördinatoren, spraaktherapeuten, vertalers, dialectologists, woordenboek makers, language trainers, audio beschrijvers en een hele reeks van professionals verdienen een leven door middel van taalgerelateerde werk.

SYSTRAN, een van de motoren met MT (Machine Translation) gebruikt door de taalindustrie (thelanguageindustry.eu) voor vertalingen uit het Nederlands naar het Frans, vertaalt 'taalprofessional' als 'professionnel de la langue'. Google Translate vertaalt het als 'professionnel langue'. Het is duidelijk, vervolgens MT motoren hebben problemen met de term 'taal professionele'.

Maar hoe zit het menselijke vertalers? Om te bepalen dit, draaide ik me om verschillende internetforums en Facebook groepen voor professionele vertalers. Het bericht ik postte gevraagd voor een Franse vertaling van 'taalprofessional' op basis van een korte tekst over de Language Industry Awards (LIAs). Ik dit bericht gepost op zes verschillende plaatsen en kreeg vier verschillende antwoorden. Een vertaler gekozen voor 'un professionnel de la langue', zei een andere 'professionnel linguistique'. Nog een ander voorgesteld 'professionnel des langues' of 'professionnel nl langues'. Deze term is uiteraard problematisch voor menselijke vertalers, alsmede machines.

Als 'taalprofessional' is een problematische term in het Frans, dan wat over taal werken, andere kernbegrippen in de taalindustrie, taal beroep, taal product en Talendiensten? En hoe zit het met andere talen dan Frans? Vertalers hebben inderdaad een overvloed aan verschillende ideeën. Dit is niet een ernstig probleem in zelf en alleen gaat om te laten zien van de verscheidenheid van de verschillende concepten die een termijn kan dekken. In ieder geval verscheen de hele kwestie meer breed variërend van dan ik had verwacht en dus des te meer de moeite waard onderzocht.

Allereerst wilde ik de hoofdtaal industrie-specifieke termen in het Nederlands zo snel en efficiënt mogelijk te verzamelen. Dit werd gedaan op een aantal manieren: Ik heb uitgevoerd een handmatig zoeken naar termen op de website van de taalindustrie, taal gestelde industrie expert Dries Debackere maken een mindmap van de taalindustrie en vervolgens gebruikt termextractietools. Dit zijn tools die automatisch termen met een tekst corpus, handig in dit geval uitpakken omdat het corpus van de taalindustrie tekst meer dan een miljoen woorden bevat.

Na een grondig onderzoek vond ik drie Termextractietools die nuttig kunnen zijn.

De eerste was AntConc, niet echt een termijn extractie tool maar een concordantie-programma. Met AntConc zocht ik naar voorwaarden en collocaties waarin de tekenreeks 'taal' verscheen. Met dit nuttige hulpmiddel, ik kon snel vaststellen van deze voorwaarden en collocaties en kon zien hoe vaak ze vond plaats in het hele corpus.

Het volgende gereedschap die ik probeerde was TermTreffer, in opdracht van de Nederlandse Taalunie voorwaarden extraheren uit Nederlandse tekstcorpora. TermTreffer is een online tool registratieplichtige. Uw login en paswoord zijn opgevraagd per post - een tijdrovend bedrijf. Zodra u bent ingelogd, vindt de winning plaats relatief snel. U uploadt uw corpus en ontvang uw voorwaarden onmiddellijk terug. TermTreffer kwam terug met 22,600 voorwaarden van onze corpus van meer dan een miljoen woorden, die geen van allen leek te zijn werkwoorden, waardoor we kunnen afleiden dat het niet een effectieve term extractie instrument was.

Een andere hulpmiddelen die ik gebruikte was TExSIS, een tool gemaakt door Universiteit Gent. Het was onmogelijk voor het uploaden van een hele corpus van een miljoen woorden, zodat ik het corpus verdeeld in tien kleinere stukken. De resultaten kwam door een paar dagen later – een lijst met 50.000 termen.

Het feit dat TExSIS gevonden zo veel taal branchegerichte voorwaarden leidde me af over de betrouwbaarheid van extractie tools in het algemeen te. Ik besloot om een handmatige Termextractie op een representatief aantal willekeurig geselecteerde artikelen uit de website van de taalindustrie. Ik vergeleken mijn eigen woordenlijst met de lijsten die zijn opgesteld door de Termextractie hulpmiddelen hierboven vermeld. De termen gevonden door AntConc had een 16% match met mijn manuele Termextractie. TermTreffer geëvenaard 7%. TExSIS had een beter resultaat en inclusief 50% van mijn handmatig uitgepakte termen, maar dan weer het produceerde ook de meeste niet-voorwaarden.

De taalindustrie moet niet alleen worden besproken in Nederlands sprekende gebieden. De Europese taalindustrie heeft 24 officiële talen. Specifieke taal industriële terminologie is ook handig over de grenzen van de taal. Vertalers en vertaling machines moeten gemakkelijk toegang hebben tot een meertalige terminologiedatabase met taal branchegerichte voorwaarden. Dit zou zeer nuttig zijn, zoals duidelijk niet alleen door de vertalers en hun opmerkingen op forums en discussiegroepen, maar ook door de verschillende MT motoren aangesloten op de meertalige website van de taalindustrie was gemaakt. Dit betekent dat wij ook moeten nadenken over een bestandstype dat is beheersbaar voor zowel de Vertaler en de machine. Dit type bestaat in feite. Het heet TBX, maar ik weet niet van wie het maakt.

Het zou echt nuttig als wij, als taalprofessionals, kon verzamelen alle onze taal industrie termen, beheren en delen ze in een ruimte waar taalprofessionals het proces helpen kunnen door het starten van een debat over elke term. Beheren, delen en bespreken op dezelfde plek.

Vind je zo'n ruimte, onderzocht ik sommige web gebaseerde platformen waar terminologie kan worden beheerd en gedeeld. Dit is hoe ik moet evoTerm, een betalende terminologiebeheersysteem waar uw inbreng honderd procent blijft eigen, waar u anderen toegang tot uw gemaakte terminologiedatabases en waar u kunt beslissen geven kunt of een gebruiker is toegestaan wijzigingen aan te brengen. De interface kan worden aangetoond in het Engels, Frans, Duits of Nederlands. Dit lijkt te zijn een goed systeem, maar er is nergens waar de voorwaarden zijn bespreekbaar. Deze functie is echt belangrijk, omdat taal industriële terminologie is nog nieuw en als zodanig nog niet stabiel.

Een andere term managementsysteem die ik nauw gekeken was TermBeheerder, ook een systeem in opdracht van de Nederlandse Taalunie en ontwikkeld door CrossLang (Gent). Dit systeem bespaart uw voorwaarden (die kunnen later worden veranderd), zodat u te voegen een heleboel contextuele informatie aan hen en - en dit is precies wat ik zocht en, naar mijn mening, wat de taalindustrie nodig - andere gebruikers gemakkelijk opmerkingen kunnen toevoegen en start discussies. Jammer dit web gebaseerde hulpprogramma is nog in een beta versie! Ik heb sommige termen hebben geüpload, maar niemand is nog verzendoptie wilt gebruiken of bewerken. Het is ook jammer dat de interface alleen in het Nederlands kan worden aangetoond. Als we een meertalige interface maken kon, zou TermBeheerder een geweldige meertalige omgeving waarin ook beheren om te starten van gesprekken over hen te verzamelen.

Conclusie: er is nog een heleboel werk te doen. Er is een behoefte ergens waar taalprofessionals gesprekken met elkaar over hun eigen terminologie in verschillende talen kunnen houden. Deze ruimte zou bij voorkeur op de locatie waar de terminologie wordt beheerd en gedeeld.

 

Zou u graag reageren op dit artikel? Voel je vrij om een e-mail sturen naar liesbet.vanoudenhove@detaalsector.be.

 

http://www.termbeheerder.org/

http://www.termtreffer.nl/

http://www.evoterm.net/

http://www.thelanguageindustry.EU/

 

 


Powered by CrossLang

Auteur: Liesbet Van Oudenhove

Machinevertaling: SDL BeGlobal

Post-editing: Geen posteditering

Brontaal: English (en)


Aanvullende gegevens