Overleg WikiWoordenboek:Transtool/archief
Intro
bewerkenHoi Allemaal
Zoals ik vroeger reeds heb laten vallen, was ik bezig met het ontwikkelen van een tooltje om het overnemen van vertalingen uit andere wikiwoordenboeken te versnellen. Dit is nu verder uitgebreid en je kan het vinden op de toolserver: Transtool
Een beetje meer uitleg en wat voorbeelden kan je vinden op Gebruiker:Annabel/Vertaalhulpmiddel. Jullie opmerkingen en suggesties zijn van harte welkom en indien het je goed bevalt, zou het tof zijn mocht je dat laten weten.
Annabel(overleg) 9 nov 2006 08:55 (CET)
- Heel mooi! :-) Volgens mij was het enige minpuntje dat er geen ondersteuning was voor de zeldzamere talen, maar daar wordt nu ook al hard aan gewerkt zie ik. Mijn complimenten! Curious 7 dec 2006 21:50 (CET)
Over transtool
bewerkenHoi Annabel: Transtool lijkt mij reuze handig. Is er ook een projectpagina van met een wat uigebreidere handleiding en ruimte voor discussie in het Nederlands? Ik heb wat opmerkingen in overleg gebruiker geplaatst: http://nl.wiktionary.org/wiki/Overleg_gebruiker:Annabel/Vertaalhulpmiddel
- Net geantwoord, voor ik dit bericht zag :-). Annabel(overleg) 30 nov 2006 17:50 (CET)
- Is het goed dat ik transtool bij een aantal lemma test en mijn bevindingen op de volgende plaats Overleg_gebruiker:Annabel/Vertaalhulpmiddel/Testen. (van Gebruiker:Raymondm op 4 dec 2006 16:49)
- Doe maar. Als er iets is, dan hoor ik het wel... Ik ga ook nog een optie toevoegen om de doeltaal niet in het resultaat te laten verschijnen. Annabel(overleg) 4 dec 2006 17:17 (CET)
- Is het goed dat ik transtool bij een aantal lemma test en mijn bevindingen op de volgende plaats Overleg_gebruiker:Annabel/Vertaalhulpmiddel/Testen. (van Gebruiker:Raymondm op 4 dec 2006 16:49)
Hoi Annabel. Erg handig tooltje (Transtool). Ik heb een paar vragen over de verdere ontwikkeling van het programma:
- 1. Ben je überhaupt van plan Transtool verder te ontwikkelen? Worden er nog meer voorkeurstalen van Wiktionary's toegevoegd, zoals het Spaans en het Pools (voorbeelden van groeiende wiktionary's)? En wordt het interface in andere als het Nederlands en het Engels vertaald?
- 2. Is het niet overzichtelijker om de betekenis: (1) voor het woord te zetten, zoals dat in het Duits ook gebeurt of juist elk betekenis in een apart veld, zoals in het Engels? (Persoonlijk denk ik dat de Engelse Wiktionary hier de beste oplossing heeft door boven ((top)) de betekenis tussen aanhalingstekens weer te geven.
- 3. Linguistisch denk ik dat er nog wat haken en ogen aan zitten om het programma te gebruiken voor het overnemen van vertalingen uit andere Wiktionary's. Het is daarom misschien handig om erbij te zetten dat men op moet passen wanneer er meerdere betekenissen bestaan. In het Engels zijn er bijvoorbeeld veel betekenissen voor een woord, maar in het Nederlands, maar één. Vervolgens komen er betekenissen bij het Nederlandse woord die er eigenlijk niet onder horen te vallen. Dit moet voorkomen worden door er zeker van te zijn alleen de gelijke betekenissen over te nemen. (Hiervoor zou eerst vraag 2 opgelost moeten worden.)
- 4. Zou Transtool ook kunnen gebruikt worden om vertaling met behulp van een Robot (zoals op Wikipedia wel gebeurt) in een bepaalde Wiktionary te unificeren. De Robot past het template dan overal toe in bijvoorbeeld de Nederlandse Wikipedia.
- 5. Wordt de tool nog ingebed in Wiktionary of een soortgelijke omgeving? Het lijkt mij het makkelijkst als de tool bijvoorbeeld bij hulpmiddelen (linker frame) staat. Ook lijkt mij het handigst om de uitleg en het omzetveld van elkaar te scheiden, zodat het omzetveld bovenaan komt te staan. Misschien is het ook handig het resultaat duidelijk boven aan te zetten.
Groet
- Beste,
- Het doet me alvast plezier dat je wat aan het tooltje hebt. Als ik kan, zou ik het tooltje zeker verder ontwikkelen. Uitbreiding van het tooltje naar andere talen is zeker mogelijk. Dit betreft geen enkel tabellenwerk; daar komt geen programmeren meer aan te pas. De interface kan eveneens naar andere talen uitgebreid worden, maar gezien ik bijvoorbeeld het Pools of het Spaans niet machtig ben, kan ik dat zelf niet doen (alle hulp is dan ook welkom).
- Het is mogelijk om de betekenis eerst te zetten, maar ik heb nog geen overzicht van welk beleid de andere wiktionary's hier omtrent voeren (daarom laat ik het voorlopig zoals het is). Indien ik hier duidelijkheid rond heb, kan dit eventueel toegevoegd worden.
- Je derde en vierder vraag hangen eigenlijk aaneen. Het tooltje is expres niet geautomatiseerd, zodanig dat je van vertalingen van andere wiki's kan overnemen. Dit komt omdat je eigenlijk een "native speaker" nodig hebt om het verschil in betekenis aan te voelen, zodat je weet welke vertaling correct is (bijvoorbeeld: wat mag je overhouden als je de vertalingen van 2 of 3 wiktionary's samenvoegt). Geautomatiseerde omzetting naar één formaat binnen hetzelfde wikiwoordenboek is in principe mogelijk, maar niet zo eenvoudig omwille van het voorkomen van verschillende opmaken. Zo werd op het Nederlandstalige wikiwoordenboek gebruikt gemaakt van rechtstreekse links voor de introductie van het trad-sjabloon (sjabloon:trad). Ik heb de indruk dat de opmaak van deze tabellen (pure wiki-code, geen sjablonen als {op}, {mid} en {bottom} of {(}, {-} en {)}) niet altijd gelijk is. Traditioneel wordt er voor dergelijke bots gebruik gemaakt van python, dat ik niet machtig ben (en voorlopig ook geen tijd voor heb om het te leren). Vertrekken van de code van autowiki browser is misschien ook een mogelijkheid, maar daar kan ik nu geen sluitend antwoord op geven. Ik wil het wel eens nagaan als je dat wil en als de Nederlandse wikiwoordenboek gemeenschap dit wenst.
- Groeten,
- Annabel(overleg) 30 nov 2006 17:50 (CET)
Volgorde van de talen in de vertalingentabel
bewerkenBij de bewerking van o.a. de artikelen Arabisch en Koerdisch heb je de volgorde van de talen (gevoelig) gewijzigd, en wel zo dat de talen nu volgens taalcode staan gesorteerd en niet volgens hun Nederlandse taalnaam. Dit is niet in overeenstemming met onze Conventies, waaruit hier een stukje volgt:
Opgelet: de volgorde van de talen dient alfabetisch te zijn op basis van de ontcijferde taalcodes (bijv. Spaans)en dit komt niet overeen met de alfabetisering van de taalcodes (bijv. es). IJslands (taalcode is) komt bij de I te staan.
Sommige mensen hebben moeite gedaan om de vertalingen in die volgorde te rangschikken. Het lijkt me beter dat je die niet verandert, tenzij daarover (een grote mate van) eensgezindheid wordt bereikt. - Jan, 9 september 2006.
- Ik werkte met mijn tooltje (zie de kroeg) en heb daarover gekeken. Ik zal het aanpassen. Annabel(overleg) 11 sep 2006 08:33 (CEST)
- Sommige talen hebben een aantal synoniemen, zoals be = Wit-Russisch of Bellarussisch. De standaardwaarde voor be stond verkeerdelijk op Bellarussisch waardoor de sortering niet goed werkte. Echter voor km stond er in de lijst met ISO-codes (WikiWoordenboek:ISO_639) als eerste synoniem Cambodjaans in plaats van Khmer, is dit nu Khmer of Cambodjaans? Voor de geode werking heb ik de standaardwaarde in mijn php-tool nu op Khmer gezet. Mochten er nog dingen zijn die niet kloppen, laat het me gerust weten. Het is is niet echt de bedoeling om dit tooltje te gebruiken voor afgewerkte pagina's, maar pagina's zoals Arabisch en Koerdisch zijn dankbaar omdat er vele vertealingen zijn en fouten dus snel aan het licht komen. Annabel(overleg) 11 sep 2006 09:12 (CEST)
- PS: de sortering is overigens niet echt dooreen geschud zoals je suggereerde
- Alfabetische volgorde van de talen IJslands en Angelsaksisch zijn nog niet geheel correct.Raymondm 27 dec 2006 01:23 (CET)
taalcodes
bewerkenMijn complimenten voor je vertaalprogamma!! Ik denk dat het erg belangrijk gaat worden voor alle wikiwoordeboeken, vooral voor de kleintjes.
- Hoi Jcwf,
- Ik zal in eerste instantie zorgen voor de ondersteuning van alle 3-letter codes. Dan kunnen we naderhand eventueel alles omzetten van tweeletter-sjablonen naar 3-lettersjablonen. Ik zou hiervoor wel eerst een stemming/peiling houden mits het welllicht over duizenden dummywijzigingen gaat.
- Annabel(overleg) 6 dec 2006 18:46 (CET)
Nog niet alle talen en taalcodes worden herkend, omdat de lijsten op wikipedia en wiktionary vaak onvolledig zijn. Het is de bedoeling dat de ISO-talen allemaal herkend worden.
- Het overnemen van andere betekenissen kan per definitie niet geautomatiseerd worden. Dit moet manueel nagekeken worden. Het is de bedoeling dat betekenissen opgesplitst worden (niet 1 sectie met alle vertalingen, maar evenveel secties als betekenissen). Het is wel de bedoeling dat dit uiteindelijk gebeurd.
- Als er nog iets is, laat het me alvast weten...
- Annabel(overleg) 30 nov 2006 17:50 (CET)
De problemen liggen vooral bij het onvolledig zijn van de lijsten met ISO-codes en/of het niet standaard zijn van de codes. Mijns inziens is er wat onderhoud nodig op WikiWoordenboek:ISO_639 (ik heb ook in het Frans, w:en:List of ISO 639-2 codes en w:en:List of ISO 639-3 codes gebruikt). Het belangrijkste is denk ik dat vooral de drie-lettercodes ondersteund dienen te worden. Het blijkt bijzonder moeilijk om een sluitende tabel te hebben met alle vertalingen van een taal in de ondersteunde brontalen en dit gekoppeld aan de lettercode; enige hulp is dan ook altijd welkom. Vooral bij "dialecten" en afgeleide talen blijkt de volledigheid moeilijk te behalen. Annabel(overleg) 5 dec 2006 08:45 (CET)
- Ik denk dat het handigste is de 639-1 te gebruiken voor de talen die hier al in staan (meestal de grotere talen). Voor andere talen kunnen we dan de 639-3 lijst gebruiken (bij de talen die in de 639-2 lijst stonden is dit meestal sowieso vrijwel gelijk aan de 639-3 codes). Bij twijfel kunnen we twee sjablonen aanhouden. Ik heb ook een idee hoe we dit zouden kunnen presenteren hier op WikiWoordenboek zie hier. Deze zijn dan te bereiken met een query vanaf de ISO-639 pagina.Raymondm 5 dec 2006 23:51 (CET)
- Het lijkt me inderdaad een vrij onbegonnen zaak om alle bestaande tweelettercodes uit te wieden, maar ik ben bezig om drieletterige versies er bij aan te maken. Zie Gebruiker:Jcwf/zandbak/water. (Ik denk dat dat alle 2lettercodes zijn) Daarmee kunnen we dus nieuwe zaken in ISO-3 formaat aanmaken.
Op zich wel grappig dat de discussie uit de kroeg (archief 3 geloof ik) over talencodes weer terug is gekomen door middel van het testen van Transtool. Even samenvatten: Transtool kan nog niet genoeg talen ondersteunen. Oorzaak; de WikiWoordenboek:ISO_639lijst die zich alleen op ISO 639-1 en 639-2 baseert. De lijst is alfbetisch geordend, maar soms op taalcode en soms op taal (ik heb de lijst even snel op taalnaam geordend). Zoals Annabel terecht opmerkte is eerst daar een schoonmaak nodig. Ben alvast begonnen A, B, C. Ik heb gecheckt bij SIL welk taal wat voor codes hebben in 639-1, 639-2 en 639-3. De tabel kan dan rustig uitgebreid worden als dat nodig is of als een gebruiker dat wil. Belangrijk is dan te weten wat de Nederlandse naam van de taal is en de ISO 639 codes. Met behulp van Jcwf's pagina Gebruiker:Jcwf/zandbak/ISO-3/A kan in ieder geval gecheckt worden of er al een Sjabloon voor de taalcode in ISO 639-3 is voor de desbetreffende taal. Ook maakt hij de sjablonen voor de ISO 639-3 voor de talen die onze ISO 639 lijst (zie mijn tabellen). De oude twee-letterige 639-1 versie kunnen we voorlopig aanhouden en later eventueel door Annabel (zie botopmerking laten vervangen).Raymondm 6 dec 2006 05:26 (CET)
Transtool translations (English discussion)
bewerkenHello, Annabel!
Jcwf told me here that you created a tool which takes the translations from en, de, fr or nl and reformats it for nl, including all the trad's and the ISO codes. I would be interested in how you realised that and in using your tool for the Romanian wiktionary as well. Is it possible to adapt it for other languages? Meaning the alfabetical order of the languages, the eventual template differences. I should appreciate it if you gave me some details. Thanks! — KlaudiuMihăilă Boodschap 6 dec 2006 15:23 (CET)
- Hi KlaudiuMihaila,
- The tool interpretes each line separately and searches for patterns. The : is important, before it, Transtool looks for languages and after it it looks for translations (including plain links or trad-templates).
- Firstly I made a table in a spreadsheet program which contains the name of the language as well as the ISO-language code (both ISO 639-2 and ISO 639-3). This table is indirectly used for determining the language (either ISO-language code or the name) for the translations on a line. In addition, it is used to sort the translations by language.
- In fact the code of the tool does not need a lot of adaptations when an other language needs to be supported. Transtool can use any language as source and destionation language if a table is present that contains the code and the name of the language. If you wish, I can give you the existing excel tables. Thus if you can add Romanian names of each language, I can add support for the Romanian language.
- Regards, Annabel(overleg) 6 dec 2006 15:43 (CET)
- PS: Success with your exams
- Thanks for your wish! I would like to receive the excel tables. I shall supply the names in Romanian. Afterwards, I guess I should send it back to you, to complete the program, right? — KlaudiuMihăilă Boodschap 6 dec 2006 16:25 (CET)
- Thats correct! Just drop me a line at annabel _at_ wikipedia.dot.be Then I shall send you the necessary information. Annabel(overleg) 6 dec 2006 18:43 (CET)
- Thanks for your wish! I would like to receive the excel tables. I shall supply the names in Romanian. Afterwards, I guess I should send it back to you, to complete the program, right? — KlaudiuMihăilă Boodschap 6 dec 2006 16:25 (CET)
Meerdere vertalingen in dezelfde taal
bewerkenInderdaad een handig hulpmiddel, die Transtool.
Als bij identieke vertalingen de ene vertaling geen genusinfo heeft en de andere wel, hangt het blijkbaar van de inputvolgorde af of die genusinfo wordt behouden. Neem de volgende gegevens en converteer ze:
*[[Frisian]]: [[wurd]] :*{{fy}}: [[wurd]] {{n}}
Verander dan de volgorde van de twee regels, converteer opnieuw en zie het verschil.
En nu een ander praktijkvoorbeeld met doorslaggevende regelvolgorde:
:*{{es}}: {{trad|es|óptiko}} {{m}} * {{es}} : {{trad-|es|óptico}}
Merk op dat van óptiko (fout Spaans, verkeerdelijk gekopieerd van Papiamento) en óptico maar 1 spelling overblijft, terwijl een k en een c toch niet dezelfde letters zijn... Zo komt de fout dus niet uit!
- Jan, 8 dec 2006
- Dat klopt jan. Enkel het laatste voorkomen van de vertalingen naar een welbepaalde taal wordt nu weerhouden. Om dubbele vertalingen te laten verschijnen in een subkopje of een apart tekstvenster is er echter nog wat (wellicht tamelijk wat) programmeerwerk nodig. Ik ga me nu echter eerst richten op de ondersteuning/herkenning van alle talen en taalcodes (ook de meer "exotische"). Alvast bedankt voor je suggestie voor foutherkenning. Annabel(overleg) 8 dec 2006 15:35 (CET)
Herkenning alternatieve taalnamen
bewerkenUit de conversie van de vertalingen van pea in het Engelse WikiWoordenboek valt het volgende te noteren:
- bij de Finse vertaling staat de toevoeging herne#Finnish die ervoor zorgt dat je onmiddellijk naar de Finse sectie van herne wordt verwezen; bij de conversie zouden dergelijke toevoegingen verwijderd moeten worden (of zou de doeltaal (hier Finnish) vertaald moeten worden)
- de Engelse taalnaam Slovene wordt niet herkend, het is een synoniem van Slovenian dat wel door Transtool wordt herkend.
- Jan, 9 dec 2006
- Vanaf 26 december 2006 worden Slovene en Slovenian allebei door Transtool herkend. Jan 27 dec 2006 03:00 (CET)
Inhoudelijke opmerkingen
bewerken- Ik had uit en:eighteen de vertalingen voor achttien geprobeerd. Werkte prima, problemen: Schots gaelic (gd) en novial (nov) niet ondersteund, en Servisch niet herkend omdat op en. dat in twee subkopjes latijns/ cyrillisch wordt onderverdeeld.
- Uit fr:tirer. zie trekken. Problemen: ang, hbo en srn (oud engels oud hebreeuws en sranan) niet herkend. Groot probleem: de vertalingen liggen door elkaar op fr. en moeten gesorteerd.
- Uit de:ziehen, zie trekken. Problemen: het Ü -sjabloon (het Duitse trad) wordt niet herkend. Verder ook hier weer een warboel omdat het systeem met nummertjes alleen werkt.
- vraag bij fout 1: wat is het onderscheid tussen {gd} en {sco} ? Annabel(overleg) 5 dec 2006 08:45 (CET)
- kweenie maar ik denk dat een ISO 639-2 de ander ISO 639-3 is. 3 werkt alleen met drielettercodes. We zouden natuurlijk rigoreus daarop over kunnen gaan maar het is wel een heleboel werk. Misschien moeten we beginnen met {{gd}} en {{-gd-}} naast {{sco}} en {{-sco-}} te genereren en dan iemand te vragen met een robot alles om te zetten. Ik denk dat je het taal voor taal moet doen. Misschien dat het zinnig is om je werktuigje alleen -3 te laten genereren. Dat zal dan wel een hoop lege links opleveren die we dan geleidelijk op kunnen vullen. De oude -2 links verwijderen lijkt me de laatste stap
Een goed proefkonijn is de bladzijde water. Dank zij SVET is dat de meest uitgebreide verzameling vertalingen
- water is inderdaad de ultieme test, maar waarschijnlijk nog te hoog gegrepen. 320 vertalingen worden niet herkend :). Misschien zijn er wat woorden die er tussenin liggen die beter geschikt zijn . Raymondm 5 dec 2006 16:28 (CET)
JCwf
Nee ik had het verkeerd sco is Scots in -3 (de germaanse taal) Gaelic was gd in -2 en is nu ghc.
Jcwf
Er is ook nog een Sjabloon voor Slovio (ISO 639-2:art) nodig.
Heb wat geprobeerd: wat we kunnen doen is een nieuwe ISO-3 bladzijde generen bijv {-ghc-} en {ghc} en dan op deze bladzijde het oude sjabloon {-gd-} en {gd} zetten. Dat werkt. Op deze manier kunnen we een tijdje beide naast elkaar gebruiken zonder een hoop lege links te krijgen
{gd} geeft: {{gd}} {ghc} geeft: klassiek Gaelisch Jcwf 5 dec 2006 16:15 (CET)
- Als er botmatige zoek-en vervangopties nodig zijn, moet je het maar laten weten. Dan fix ik het wel met AutoWiki Browser. Annabel(overleg) 5 dec 2006 16:19 (CET)
Om de diverse codes voor een taal te vinden zie hier
Probleemcodes
bewerkenWanneer we rigoreus gaan doen en alle 3letter codes van iso 639-3 in gaan voeren krijgen we wel te maken met een paar probleemcodes, een aatal drieletter codes die tot (vrij onbekende) talen behoren zijn namelijk al in gebruik. Dat geldt voor:
- {{dat}},{{beg}},{{acc}},{{dim}}, {{nom}}
ze geven:
Het vervelende is dat bijvoorbeeld dim al op meer dan 1500 lemma's gebruikt wordt.
De naamvallen valt wel mee, dat is niet meer dan 20 of zo. Die zouden we dus kunnen hernoemen naar .dat. of zo.
- Ik kwam er ook al één tegen. Ik wilde mar voor Marathi gebruiken, maar dit is al het standaard Sjabloon voor Maart (mrt). Echt iets dat het best door een bot is op te lossen lijkt mij zo.Raymondm 12 dec 2006 00:13 (CET)
- Nu weet ik niet wat je hiermee bedoeld, maar mlij lijkt het het best af te spreken, dat als we volledig voor ISO 639-3 codes gaan, dit overal zo is en de andere sjablonen dan hernoemd moeten worden. Annabel(overleg) 12 dec 2006 09:34 (CET)
- Ja, het hernoemen is niet zo probleem, maar de vraag is veranderen de sjablonen (die al in gebruik zijn) automatisch mee of moet een bot dit oplossen? Tweede probleem is dat bijvoorbeeld bij mijn voorbeeld het Sjabloon 'mar' beveiligd is en ik dat als gebruiker niet kan veranderen. Raymondm 12 dec 2006 17:27 (CET)
- Nu weet ik niet wat je hiermee bedoeld, maar mlij lijkt het het best af te spreken, dat als we volledig voor ISO 639-3 codes gaan, dit overal zo is en de andere sjablonen dan hernoemd moeten worden. Annabel(overleg) 12 dec 2006 09:34 (CET)
- Ik kwam er ook al één tegen. Ik wilde mar voor Marathi gebruiken, maar dit is al het standaard Sjabloon voor Maart (mrt). Echt iets dat het best door een bot is op te lossen lijkt mij zo.Raymondm 12 dec 2006 00:13 (CET)
- Ik heb Levenius verwittigd ik denk dat hij de beveiliging wel kan opheffen. Het lijkt me zinnig #eerst een bestandsopname te maken van welke drielettercodes vervangen dienen te worden
- te belsuiten waar het door te vervangen
- nieuwe sjablonen aan te maken
- een bot verzoek te doen
Overigens is er niet echt haast met de meeste omdat het om erg incourante talen gaat (Marathi wellicht uitgezonderd).
Een ander punt:
- gaan jullie accoord de hooftaalsjablonen op zijn frans te doen, zoals =nld=? Dat voorkomt namelijk hetzelfde gedoe met sommige andere koppen zoals -drv- en -rel-.
- Beveiliging opheffen kan altijd gedaan worden door één van de mods. Hernoeming kan ook altijd door middel van een bot (of AutoWikiBrowser). Deze Franse manier van werken die hier anoniem werd aangehaald zie ik echter niet zitten. Annabel(overleg) 12 dec 2006 18:11 (CET)
- Oeps ik was niet ingelogd, sorry annabel. waarom zie je het niet zitten? We moeten namelijk ofwel een andere conventie voor de hoofdtaalsjablonen gebruiken dan voor de overige koppen (de fransen hebben het zo gedaan =xxx= voor hoofdtalen, -xxx- voor koppen)) of we moeten drieletterkoppen bperken tot talen, dwz -drv- vervangen door -drvt- of zo. Beide handhaven geeft problemen omdat drv een taal is.
- Jcwf 12 dec 2006 18:28 (CET)
- Beveiliging opheffen kan altijd gedaan worden door één van de mods. Hernoeming kan ook altijd door middel van een bot (of AutoWikiBrowser). Deze Franse manier van werken die hier anoniem werd aangehaald zie ik echter niet zitten. Annabel(overleg) 12 dec 2006 18:11 (CET)
- Hoi Jcwf, Nu bekruipt mij het beklemmende gevoel dat we (of althans ik jou) elkaar verkeerd begrijpen. Kun je op een zandbakpagina even de code van een bestaande pagina geven over hoe het volgens jou zou moeten? Dat zou wel het een en ander kunnen verduidelijken. :) Annabel(overleg) 13 dec 2006 09:26 (CET)
- OK. Is in orde. Dan kunnen we best eerst een bot hierop laten lopen om dit af te handelen en nadien Transtool/AWB/een andere bot erover laten gaan. Annabel(overleg) 15 dec 2006 15:39 (CET)
- Hoi Jcwf, Nu bekruipt mij het beklemmende gevoel dat we (of althans ik jou) elkaar verkeerd begrijpen. Kun je op een zandbakpagina even de code van een bestaande pagina geven over hoe het volgens jou zou moeten? Dat zou wel het een en ander kunnen verduidelijken. :) Annabel(overleg) 13 dec 2006 09:26 (CET)
- Ik ben het eens met het stappenplan (zoals hierboven aangegeven). Misschien kunnen we zandbak voor de bestandsopname te maken, zodat we dat in ieder geval kunnen inventariseren. Wat de drieletterkoppen betreft is het denk ik handiger ze te vervangen door vierletterkoppen (e.d.), zodat er geen verwarring ontstaat met de ISO-codes ontstaat.Raymondm 12 dec 2006 19:07 (CET)
Meerdere namen voor een taal
bewerkenUit de conversie van de vertalingen van pea in het Engelse WikiWoordenboek valt het volgende te noteren:
- bij de Finse vertaling staat de toevoeging herne#Finnish die ervoor zorgt dat je onmiddellijk naar de Finse sectie van herne wordt verwezen; bij de conversie zouden dergelijke toevoegingen verwijderd moeten worden (of zou de doeltaal (hier Finnish) vertaald moeten worden)
- de Engelse taalnaam Slovene wordt niet herkend, het is een synoniem van Slovenian dat wel door Transtool wordt herkend.
- Jan, 9 dec 2006
- OK. Ik zal het (wat later) toevoegen. Er wordt nu zoveel getest, dat ik het bijna niet kan bijhouden. Groet, Annabel(overleg) 9 dec 2006 19:36 (CET)
- Naast de ondersteunde Engelse taalnaam Faroese, die in de ISO 639-3-lijst staat, komt in Engelse vertalingstabellen ook de synonieme, maar niet-ondersteunde taalnaam Faeroese voor. Overigens wordt Slovene, dat in de Engelse Wiktionary veel gebruikelijker is dan Slovenian, nog steeds niet herkend door Transtool, al is dat volgens Ethnologue een alternatieve naam voor Slovenian (zie http://www.ethnologue.com/show_language.asp?code=slv). Het zou handig zijn als die synoniemen allebei werden herkend zodanig dat je die niet handmatig moet aanpassen in het inputvak. Jan 26 dec 2006 01:37 (CET)
- Zou nu in orde moeten zijn. Annabel(overleg) 26 dec 2006 10:50 (CET)
- Nog enkele alternatieve taalnamen waarvan alleen de eerste wordt herkend:
Low German / Low Saxon,
Ossetian / Ossetic,
Scottish / Scots (Voor deze Germaanse taal is Scots de (enige) naam die Ethnologue vermeldt, zie http://www.ethnologue.com/show_language.asp?code=sco.)
Scottish-Gaelic / Scottish Gaelic / Scots Gaelic (De naam van deze levende Keltische taal wordt in het Engels zonder streepje geschreven.) Jan 26 dec 2006 05:48 (CET)- Zou nu in orde moeten zijn. Annabel(overleg) 26 dec 2006 10:50 (CET)
- Inderdaad, gisteren herkende Transtool die talen nog niet, nu wel, zoals blijkt uit de vertalingen van France in de Engelse Wiktionary. Daar stond nog een taal die (in het Engels) verschillende namen heeft, namelijk
Dhivehi / Divehi / Maldivian (ISO 639-3: div).
Ik heb zelf even moeten uitzoeken welke taal Maldivian precies was. Jan 27 dec 2006 06:37 (CET)
- Naast de ondersteunde Engelse taalnaam Faroese, die in de ISO 639-3-lijst staat, komt in Engelse vertalingstabellen ook de synonieme, maar niet-ondersteunde taalnaam Faeroese voor. Overigens wordt Slovene, dat in de Engelse Wiktionary veel gebruikelijker is dan Slovenian, nog steeds niet herkend door Transtool, al is dat volgens Ethnologue een alternatieve naam voor Slovenian (zie http://www.ethnologue.com/show_language.asp?code=slv). Het zou handig zijn als die synoniemen allebei werden herkend zodanig dat je die niet handmatig moet aanpassen in het inputvak. Jan 26 dec 2006 01:37 (CET)
- Er gaat iets mis met de Engelse taalnaam Haitian. Transtool ondersteunt die niet. Maar als je {{ht}} of {{hat}} omzet naar een taalnaam, blijkt het resultaat Haitian : te zijn. Merk op dat er een spatie staat vóór de dubbelepunt, misschien zit daar het probleem. Indien dat zo is, kijk dan eens na of er in de talendatabase nog spaties staan die problemen veroorzaken. Een andere oorzaak kan de trema zijn die op de eerste i van de Nederlandse taalnaam moet staan. Transtool vertaalt Haitian naar Haitiaans (zonder trema) in plaats van Haïtiaans (met trema). Zie daarover http://taaladvies.net/taal/aardrijkskundige_namen/land/HT. Nog een mogelijke oorzaak zou kunnen zijn dat voor Haïtiaans verkeerdelijk de code ha stond aangegeven, terwijl die code gereserveerd is voor Hausa. Jan 26 dec 2006 03:58 (CET)
- Zou nu in orde moeten zijn. De aanwezigheid van de spatie heb je goed opgemerkt (en dat was ook meteen het probleem). Deze gegevens zijn in excel ingevoerd en daarin zie je een spatie teveel bij de taal bijna niet staan. Annabel(overleg) 26 dec 2006 10:50 (CET)
- Er gaat iets mis met de Engelse taalnaam Haitian. Transtool ondersteunt die niet. Maar als je {{ht}} of {{hat}} omzet naar een taalnaam, blijkt het resultaat Haitian : te zijn. Merk op dat er een spatie staat vóór de dubbelepunt, misschien zit daar het probleem. Indien dat zo is, kijk dan eens na of er in de talendatabase nog spaties staan die problemen veroorzaken. Een andere oorzaak kan de trema zijn die op de eerste i van de Nederlandse taalnaam moet staan. Transtool vertaalt Haitian naar Haitiaans (zonder trema) in plaats van Haïtiaans (met trema). Zie daarover http://taaladvies.net/taal/aardrijkskundige_namen/land/HT. Nog een mogelijke oorzaak zou kunnen zijn dat voor Haïtiaans verkeerdelijk de code ha stond aangegeven, terwijl die code gereserveerd is voor Hausa. Jan 26 dec 2006 03:58 (CET)
- Op dit ogenblik heeft Transtool nog een aantal onvolkomenheidjes. Daarom moet je zelf bijsturen door bijv. (in vertalingen uit de Engelse Wiktionary) in het inputvak Slovene te vervangen door Slovenian of door het sjabloon URchar te verwijderen. Daarbij moet je voortdurend scrollen, ook al omdat het beeld telkens naar boven schuift na een klik op de conversieknop. Ook moet je bijna steeds scrollen om onderaan in het outputvak te ontdekken welke talen niet worden ondersteund.
Om het scrollen aanzienlijk te verminderen, zou ik willen vragen om de lay-out van het Transtool-venster te veranderen en wel zo dat het input- en outputvak zo groot mogelijk worden gemaakt. Nu blijft er aan de rechterkant van het inputvak en - in mindere mate - van het outputvak veel witte ruimte. Bovendien blijft veel vensterruimte aan de rechterkant van de vakken onbenut. En ten slotte lijkt het me ook zonde dat aan de bovenkant (met de voorkeuren) nuttige ruimte wordt verloren. Daarom stel ik voor om het inputvak en het outputvak NAAST elkaar te plaatsen, liefst in een 50-50-verdeling. Daardoor worden die vakken smaller (wat meestal geen probleem is), maar vooral langer (in verticale zin). Het input- en outputvak kunnen nog langer gemaakt worden als bovenaan de voorkeurinstellingen worden ingekort, bijvoorbeeld door ze in- en uitklapbaar te maken. Je verandert die instellingen namelijk toch niet voortdurend! Wel moet de Converteer-knop voortdurend in beeld blijven.
Probeer het eens uit en laat desnoods de gebruikers kiezen tussen onder elkaar liggende of naast elkaar liggende vakken. Jan 26 dec 2006 02:18 (CET)- Slovene wordt nu herkend. Het URchar sjabloon wordt nu ook weggehaald indien nodig. Je hebt en mooie suggestie voor de interface en ik zal het misschien eens uitproberen. Ik heb echter geen idee hoe in HTML een tekstvenster een variabele breedte kunt meegeven. Annabel(overleg) 26 dec 2006 10:50 (CET)
- Zoals hierboven terloops vermeld, wordt het sjabloon URchar niet door Transtool herkend. Dit in tegenstelling tot de vergelijkbare sjablonen ARchar en FAchar (en het niet-verwante THchar). Probeer maar eens *Urdu: {{URchar|[[اردو|اُردو]]}} (urdū) te converteren.
Er is met deze sjablonen een probleem als er 2 of meer vertalingen naast elkaar staan, zoals in *Persian: {{FAchar|[[انگبین]]}} (angabin), {{FAchar|[[عسل]]}} (asal). Misschien neemt Transtool de eerste {{ en de laatste }} en beschouwt hij wat daartussen staat als een vertaling. Jan 26 dec 2006 06:47 (CET)- Dit blijkt het geval te zijn sinds een vorige update die ik maakte. Ik heb het achterliggende mechanisme voor de sjabloon-verwijdering teruggedraaid en het werkt nu weer zoals vanouds. Heel hartelijk dank voor het testen en voor je opmerkingen Jan. Dit verdient een pluimpje! Annabel(overleg) 26 dec 2006 10:50 (CET)
- Blijkbaar wil het in het volgende geval toch nog niet lukken: *Arabic: {{ARchar|[[فرنسا|فَرَنسَا]]}} (faránsa) {{f}}. Vermoedelijk staat er een verticaal streepje meer dan Transtool verwacht. Jan 27 dec 2006 05:08 (CET)
- Dit blijkt het geval te zijn sinds een vorige update die ik maakte. Ik heb het achterliggende mechanisme voor de sjabloon-verwijdering teruggedraaid en het werkt nu weer zoals vanouds. Heel hartelijk dank voor het testen en voor je opmerkingen Jan. Dit verdient een pluimpje! Annabel(overleg) 26 dec 2006 10:50 (CET)
- Op dit ogenblik heeft Transtool nog een aantal onvolkomenheidjes. Daarom moet je zelf bijsturen door bijv. (in vertalingen uit de Engelse Wiktionary) in het inputvak Slovene te vervangen door Slovenian of door het sjabloon URchar te verwijderen. Daarbij moet je voortdurend scrollen, ook al omdat het beeld telkens naar boven schuift na een klik op de conversieknop. Ook moet je bijna steeds scrollen om onderaan in het outputvak te ontdekken welke talen niet worden ondersteund.
Over het ondersteunen van talen in Transtool
bewerkenEr zijn momenteel (2006) nog veel talen die (nog) niet door Transtool ondersteund worden. Nynorsk is hiervan (ISO 639-3: nno) een voorbeeld. Het doel is echter tenminste alle ISO 639-3 talen die hier op WikiWoordenboek voor vertalingen gebruikt worden te ondersteunen. In de volgende versie van Transtool zal diens database aangevuld worden met alle talen, zoals deze in de ISO 639 lijst staan. Mocht je daar een taal missen, vul dan gerust de lijst aan. Raymondm 23 dec 2006 17:55 (CET)
Update
bewerkenEr is nu een uitgebreide ondersteuning van de ISO 639-3 codes beschikbaar. Zodra er duidelijkheid is omtrent de probleemcodes zal ik deze standaard aanzetten, zoals hier overeengekomen . Je kan de ISO 639-3 codes voorlopig gebruiken door in "Lay-out voor resultaat:" "{{tl}}" door "{{tl3}}" (telkens zonder aanhalingstekens) te vervangen. Annabel(overleg) 22 dec 2006 22:59 (CET)
- Zo weer een stap vooruit. Er moet natuurlijk nog het een en ander testwerk worden verricht, maar de eerste resultaten zijn in ieder geval bemoedigend. :) Raymondm 23 dec 2006 00:38 (CET)
{{trans-top}}
bewerkenIk zag dat Transtool ook het volgende sjabloon {{trans-top}} voor het begin, midden en einde van de vertalingen ondersteund. Dit sjabloon wordt op het Engelse WikiWoordenboek veel gebruikt, maar echter nog niet ondersteund op het (Nederlandstalige) WikiWoordenboek. Het lijkt me dan ook handig deze pas als optie aan te bieden als dit sjabloon op het WikiWoordenboek ondersteund wordt.
- Het is geen probleem om deze sjablonen over te kopiëren. Deze kunnen we alleen geleidelijk invoeren, gezien deze sjablonen vooral hun nut hebben als vertalingen opgesplist worden per verklaring van een woord. Annabel(overleg) 27 dec 2006 11:00 (CET)
- Nuttig is deze opmaak bij erg veel vertalingen en meerdere betekenissen. Maar, ik vraag me af of Sjablonen die CSS gebruiken eenvoudigweg te kopiëren zijn. Raymondm 27 dec 2006 20:12 (CET)
- Normaal kan dit zonder problemen. Annabel(overleg) 27 dec 2006 20:58 (CET)
- Ik heb geprobeerd en mij lukt het niet direct. Misschien lukt het jou wel? Raymondm 28 dec 2006 20:42 (CET)
- Ik heb de sjablonen overgekopieerd. Om het te laten werken heb ik css-code moeten toevoegen die zijn invloed heeft op de volledige site. Het zou nu moeten werken (rapporteer fouten in de opmaak over de ganse site). Annabel(overleg) 28 dec 2006 21:39 (CET)
- Een testje van het gebruik van {{trans-top}}, {{trans-mid}} en {{trans-bottom}} vind je in de zandbak. Annabel(overleg) 28 dec 2006 21:55 (CET)
- Ok, hij werkt nu als normaal sjabloon voor vertalingen, maar echter nog niet als uitschuifbaar sjabloon, zoals op Wiktionary. Raymondm 28 dec 2006 22:56 (CET)
- Ik heb geprobeerd en mij lukt het niet direct. Misschien lukt het jou wel? Raymondm 28 dec 2006 20:42 (CET)
- Normaal kan dit zonder problemen. Annabel(overleg) 27 dec 2006 20:58 (CET)
- Nuttig is deze opmaak bij erg veel vertalingen en meerdere betekenissen. Maar, ik vraag me af of Sjablonen die CSS gebruiken eenvoudigweg te kopiëren zijn. Raymondm 27 dec 2006 20:12 (CET)