Arnaudleene
|
Koffie-extract
bewerkenDank voor het toevoegen van een reeks vertalingen. De officiële schrijfwijze (die we op WikiWoordenboek aanhouden), is koffie-extract en dat lemma bestond al. Daarom heb ik de extra informatie op de pagina die je toevoegde (voornamelijk de vertalingen) daarheen verplaatst. --MarcoSwart (overleg) 10 sep 2021 14:26 (CEST)
OK, bedankt.
- Ik kom echter de schrijfwijze veel zonder koppelteken tegen. Is dat geen probleem bij het vinden van dit woord dan?
- Ik was ook niet zeker of ik dit soort woordcombinaties zou moeten toevoegen. --Arnaudleene (overleg) 10 sep 2021 15:35 (CEST)
- Voor de meeste zoekmachines maakt spatie of koppelteken niet veel verschil. Kijk maar wat er gebeurt als je "koffie extract" intoetst. Veel mensen raadplegen een woordenboek omdat ze willen weten wat de officiële spelling is.
- Echte woordcombinaties met een betekenis die niet direct duidelijk is als je naar de afzonderlijke woorden kijkt, nemen we tegenwoordig ook als lemma op. Maar "koffie extract" is meer een voorbeeld van wat sommigen de "Engelse ziekte" noemen: het bijvoeglijk gebruik van een zelfstandig naamwoord. Dat kan grammaticaal wel zo in het Engels, maar in het Nederlands maken we er dan één samengesteld woord van, dat in dit geval vanwege de klinkerbotsing met een koppelteken wordt geschreven. --MarcoSwart (overleg) 10 sep 2021 20:41 (CEST)
- Dus koffie-extract is op het randje. --Arnaudleene (overleg) 11 sep 2021 09:20 (CEST)
Vertalingen
bewerkenHoe kan ik het beste met vertalingen omgaan? Ik zou een heleboel kunnen importeren vanuit een van mijn andere projecten. --Arnaudleene (overleg) 11 sep 2021 09:20 (CEST)
- Het is fantastisch als het aantal vertalingen wordt uitgebreid. Er zijn een paar dingen om daarbij in het oog te houden:
- Er mag uiteraard geen inbreuk worden gemaakt op databankrechten van andere auteurs of uitgevers.
- De vertalingen moeten wel aan de opzet van WikiWoordenboek zijn aangepast. Soms worden er simpelweg Wikipedia-interwiki's als "vertalingen" op WikiWoordenboek gezet, maar die vlieger gaat lang niet altijd op: zo krijgen titels in een encyclopedie vaak een vorm (bijvoorbeeld: een hoofdletter of een naamval) die ze als trefwoord in een woordenboek niet hebben en leveren titels die eenzelfde onderwerp beschrijven inhoudelijk niet altijd een zuivere vertaling op.
- We proberen bij talen waarin woorden een geslacht hebben, die informatie al mee te geven bij de vertaling, met m, v etc. Ik kan me indenken dat dat bij invoer op grote schaal nog best ingewikkeld is en misschien doen we er goed aan dat dan als tweede fase per taal op te pakken. We kunnen dan misschien meteen ook de pagina's voor die vertalingen aanmaken.
- Bij aalbes viel me op dat je van een aantal talen de vertaling verwijderd hebt. Als een gegeven vertaling niet (helemaal) juist is, is degeen die dat signaleert meestal ook in staat om een betere vertaling toe te voegen. Het is daarom ongebruikelijk om vertalingen zomaar te verwijderen.
- Ik weet niet of deze antwoorden adequaat zijn, ik geef met alle genoegen meer toelichting. En als de informatie al goed gestructureerd is, wil ik ook wel kijken hoe we een bot kunnen gebruiken. --MarcoSwart (overleg) 11 sep 2021 23:24 (CEST)
Ter uitleg: ik werk aan de taxonomieën van OpenFoodFacts en dan met name aan die van ingrediënten, zoals deze op productetiketten gevonden kunnen worden. De opbouw van deze ingredient-woordenlijst wordt gedaan door de bijdragers van OFF (onder open licenties). Om wat meer vaart te zetten achter de opbouw gebruiken we ook wikidata (en ik probeer nu ook wiktionary, want lijkt beter) om de lijsten te vullen. En viceversa dragen we de vertalingen (en objecten) die wij hebben gevonden hebben weer bij aan wikidata. Mijn experimenten met de Nederlandstalige wiktionary is om te kijken wat ik hier kan betekenen.
Ik probeer de kwaliteit van de vertalingen te waarborgen door checks uit te voeren op andere sites. We hebben trouwens niet de gegevens van het geslacht van woorden, dus kan ik die niet toevoegen. Ik kan de vertaling die volgens mij incorrect zijn laten staan (na mijn checks), als dat het beleid is. Als ik de taal niet spreek, ga ik niet op jacht naar de correcte vertaling (er is al genoeg te doen).
Wat is trouwens het beleid van gegevensuitwisseling tussen de diverse wiktionaries. Zo zijn veel goede vertaling op de engelstalige te vinden. --Arnaudleene (overleg) 12 sep 2021 09:21 (CEST)
- Wiktionary's nemen traditioneel vertalingen van elkaar over, bronvermelding is niet nodig, omdat simpele, directe vertalingen van een woord feiten zijn waarop geen auteursrecht mogelijk is. Op een verzameling van dat soort feiten kan wel databankenrecht bestaan, maar in dat geval is wiktionary op te vatten als één databank. Bij grote, rijpe wiktionary's is de kwaliteit van de vertalingen meestal wel op orde, maar soms is enige controle nodig. Maar daar ben je uit anderen hoofde al mee bezig.
- Voor aanwezige, minder precieze vertalingen heb ik op bij aalbes een suggestie gedaan. Op wikidata is er een apart onderdeel gebouwd met zogenaamde Lexemes om rekening te houden dat natuurlijke taal en vertalingen zich anders gedragen dan de meer precies gedefinieerde vaktaal. Mijn suggestie maakt het mogelijk om beide in samenhang te laten zien. Dit is deels ook een antwoord op je twijfel hieronder bij de redenering "iemands anders heeft het ook al" en voorkeur voor "de definitie is specifieker dan de samengestelde delen". Dat laatste principe gaat wel op voor vaktaal, maar bij het bestuderen en in een woordenboek vastleggen van natuurlijke taal wordt gekeken naar het feitelijk taalgebruik. Als "iemand anders" dat via zorgvuldig verzamelde fiches (Groot Woordenboek der Nederlandsche Taal) of miljoenen woorden uit tekstcorpora doet, kan dat laten zien dat alledaagse taal en vaktaal verschillen. Dat is geen "fout" in een van beide, het is hoe taal werkt: contextafhankelijk. Een slimme elektrotechnicus zal de bediening in het internetcafé vragen naar een "stopcontact", terwijl hij het met zijn collega over een "wandcontactdoos" heeft. --MarcoSwart (overleg) 13 sep 2021 11:15 (CEST)
Even een paar kleine tips
bewerkenDag Arnaudleene, je bent al een eind op de goede weg hier zie ik. Even het volgende: op eendenlever, kippenlever en kalkoenlever heb ik zojuist een paar aanpassingen/toevoegingen gedaan om de pagina's helemaal geschikt te maken. Er ontbraken o.a. nog voorbeeldzinnen (op Sjabloon:citeer staan de sjablonen die meestal gebruikt worden om tekst van elders aan te halen, waarbij rekening wordt gehouden met auteursrechten). Ook werken we hier met speciale sjablonen om het onderwerpsveld beter af te bakenen (bij de hier genoemde voorbeelden is dat bijv. "vogels" en "voeding" aangezien wanneer deze woorden worden gebruikt, het meestal gaat om het door mensen eten van deze vogellichaamsdelen).
Verder is een link naar WP eigenlijk alleen de bedoeling als het artikel of de redirect precies overeenkomt met de naam van de pagina hier (linken naar het algemenere onderwerp w:Kalkoen op kalkoenlever is dus in principe niet de bedoeling; die link heb ik dan ook verwijderd).
Veel succes hier verder. Groet, De Wikischim (overleg) 12 sep 2021 13:37 (CEST)
- De voorbeeldzinnen mag ik dus ook uit mijn duim zuigen (na inspiratie opgedaan te hebben)? Ik was al begonnen met onderwerpsvelden toe te voegen, maar heb nog geen overzicht wat ik toe zou kunnen voegen. Ok voor de wikipedia. zou ik ook wikidata links kunnen toevoegen? --Arnaudleene (overleg) 12 sep 2021 13:46 (CEST)
PS volg een beetje wat ik toevoeg om de kwaliteit te borgen. Ik heb nogal wat te doen.
- Wat betreft zelfbedachte voorbeeldzinnen: ja, in principe mag dat gewoon, natuurlijk met als voorwaarde dat de zin taalkundig helemaal correct moet zijn. Zelf heb ik een lichte voorkeur voor het aanhalen van reeds bestaande teksten, dit terzijde. Met kwesties m.b.t. Wikidata kan ik je vrees ik niet echt helpen, ik snap je vraag misschien ook niet helemaal goed. Links onderaan een pagina die leiden naar WP mogen iig zomaar niet worden vervangen door Data-links. (Zie verder WikiWoordenboek:De Kroeg, waar al dit soort vragen bijna altijd naar tevredenheid worden beantwoord). De Wikischim (overleg) 12 sep 2021 15:41 (CEST)
Nieuwe lemma's
bewerkenIk zie de kroeg als een goede plaats voor beleidsmatige vragen (wikidata past daar), maar waar kan ik kleinere vragen stellen, zoals: wat doe ik met de term witte rijst of parboiled rijst, zou dat onder rijst kunnen pas, of is een nieuw lemma beter? --Arnaudleene (overleg) 12 sep 2021 19:59 (CEST)
- In het algemeen is De Kroeg een goede plek voor vragen en voorstellen die niet specifiek op een bepaalde pagina of gebruiker betrekking hebben. Dat mogen ook best kleinere vragen zijn. Iedere bewerker van WikiWoordenboek loopt in het begin tegen tal van vragen aan; in dat geval is het vaak doeltreffender om gericht vragen te stellen aan een gebruiker die langer actief is; dat kan in die beginfase prima via deze overlegpagina.
- Een verbinding (meer woorden die samen een betekenis uitdrukken) kan altijd worden vermeld op de pagina van een woord dat daar deel van uitmaakt, maar als het de bedoeling is er ook specifieke vertalingen voor te geven, kan dat echt beter op een nieuwe, eigen pagina gebeuren. De term "witte rijst" stond al in het grote Woordenboek der Nederlandsche Taal en "parboiled (rijst)" is in de Etymologiebank opgenomen, dus degelijke referenties zijn mogelijk.
- Ik heb geen idee om hoeveel Nederlandse woorden het gaat, maar je zou er een lijstje van kunnen maken en dat systematisch aflopen:
- bestaat er al een pagina
- wordt daarop (ook) een Nederlands woord vermeld
- is dat Nederlandse woord een zelfstandig naamwoord
- wordt daaronder de specifieke betekenis waar het om gaat al vermeld
- Afhankelijk van het antwoord kan er vervolgens een passende aanvulling plaatsvinden. In mijn ervaring is het voordeel van zo'n systematische aanpak dat je zo vier lijstjes krijgt met pagina's die alle om een vergelijkbare aanpak vragen. Je krijgt dan wat sneller routine. Je hebt misschien zelf al ontdekt: hoe minder informatie er al is, hoe meer je moet toevoegen, maar dat is per saldo vaak minder werk dan het invoegen van een beetje informatie dat precies op de goede plaats moet worden ingepast.
- Bij vaktermen met een goed afgebakende definitie kan met het sjabloon {{d}} een link naar WikiData worden gemaakt. Op Van Pamel en Deventer zijn daarvan voorbeelden te vinden. Deze ontwikkeling staat hier nog in de kinderschoenen. Omdat woorden in het gewone taalgebruik in de regel geen scherp afgebakende betekenis hebben is het bijna altijd een slecht idee om een algemene betekenis van een woord aan een wikidata-item te koppelen. Maar bij vaktermen is het wel denkbaar. Bij woorden die zowel een ruime betekenis in het spraakgebruik hebben als een meer precieze in de vaktaal, zou ik die meer specifieke betekenis als subbetekenis met een contextlabel vermelden, en daarbij de wikidatalink geven. MarcoSwart (overleg) 12 sep 2021 22:56 (CEST)
Bedankt voor het uitgebreide antwoord. Ik ben niet zo enthousiast over de redenering "iemands anders heeft het ook al", dus is het ok. Mijn redenering was meer: de definitie is specifieker dan de samengestelde delen. Ik maak deze pagina's aan en kijk at je er van vind. --Arnaudleene (overleg) 13 sep 2021 09:02 (CEST)-
- Ik heb op witte rijst een aantal aanpassingen stapsgewijs doorgevoerd, voorzien van wat meer toelichting dan gebruikelijk. Wat je had gemaakt was op zichzelf al een verrijking van het woordenboek, dus het aantal aanpassingen wil niet zeggen dat er veel mis was met je werk. Een paar tips kun je in de toekomst gemakkelijk meenemen en de rest (zoals IPA, meer precieze etymologische beschrijvingen en woordgeslachten bij vertalingen) kan ook in de toekomst worden toegevoegd.
- Omdat je bestanden met vrije licentie gebruikt, blijf ik wel benieuwd of er een manier is waarop we die nog wat kunnen verrijken met woordsoort en woordgeslacht en daarna kunnen benutten om niet alleen vertalingen, maar ook lemma's in die talen toe te voegen. --MarcoSwart (overleg) 13 sep 2021 10:53 (CEST)
- Er kan ongetwijfeld nog van alles toegevoegd worden. Als ik weet waar ik het kan vinden probeer ik dat te doen. Wat de vertalingen betreft, in hoeverre is er een link tussen de wiktionaries in de diverse talen? Het met mogelijk zijn om een deel er van te automatiseren. Het is me trouwens niet gelukt om aan interwiki-link naar https://www.wikidata.org/wiki/Q2674257 aan te leggen. --Arnaudleene (overleg) 13 sep 2021 11:22 (CEST)
- Het is van belang even in gedachten te houden dat iedere wiktionary alle woorden uit alle talen in de taal van die wiktionary beschrijft. De rode links in onze vertaaltabellen geven dus aan dat die pagina's op WikiWoordenboek nog gemaakt moeten worden. De meeste wiktionaries laten in de vertaaltabel een superscript taalcode achter het woord zien die in beginsel doorlinkt naar dat woord in de betreffende wiktionary. Bijvoorbeeld: door het {{trad}} sjabloon te gebruiken, linkt het (en) achter "white rice" door naar die pagina in de engelstalige wiktionary. Helaas geeft de kleur van de link in dit geval geen uitsluitsel over het bestaan van die pagina, omdat dat stukje programmatuur niet werkt voor links tussen wiki's. Interwiki's worden op wiktionary's automatisch aangemaakt, maar ze verwijzen altijd naar hetzelfde woord op andere wiktionary's. Dus zolang er op de Engelstalige wiktionary geen pagina "witte rijst" is aangemaakt, zal die niet niet in de linkerkolom verschijnen. Uit het feit dat er op "witte rijst" geen interwiki's staan, valt zo ook af te leiden dat WikiWoordenboek op dit moment de enige wiktionary is waar dat woord wordt beschreven.
- Ik heb een directe link naar het item op Wikidata toegevoegd. Wie bekend is met Wikidata krijgt zo toegang tot een hoop aanvullende informatie. Het is uitdrukkelijk niet de bedoeling om directe links van Wikidata-items naar pagina's in de hoofdnaamruimte van een Wiktionary aan te brengen: in principe beschrijft een pagina in Wiktionary een woord (reeks letters of klanken) dat meerdere betekenissen kan hebben, die weer op verschillende Wikidata-items betrekking hebben; dit wordt nog versterkt doordat op die pagina hetzelfde woord (letterreeks) ook in andere talen kan worden beschreven.
- In het verleden is het geautomatiseerd overnemen van vertalingen van andere wiktionary's op grote schaal gebeurd, maar er was te weinig animo om de betreffende programmatuur aan te passen aan de veranderingen die Wikimedia bleef doorvoeren aan de mogelijkheden om Javascript te gebruiken. In prinicipe is het zeker wenselijk om die draad weer op te pakken en ik zou daar zelfs graag aan bijdragen, maar mijn kennis van Javascript en met name de manier waarop die binnen Wikimedia kan worden gebruikt is daarvoor onvoldoende. Als je dat op wilt pakken, zal ik graag mijn steentje bijdragen. --MarcoSwart (overleg) 13 sep 2021 13:40 (CEST)
- Ik zal zo veel mogelijk de links naar wikidata opnemen. Ik controleer deze nu toch al, zodat het inderdaad hetzelfde object (ingredient in mijn geval) is. Dit is zeker nu niet zo. (ik heb geen verstand van javascript, dus daar kan ik niet helpen)
- Er kan ongetwijfeld nog van alles toegevoegd worden. Als ik weet waar ik het kan vinden probeer ik dat te doen. Wat de vertalingen betreft, in hoeverre is er een link tussen de wiktionaries in de diverse talen? Het met mogelijk zijn om een deel er van te automatiseren. Het is me trouwens niet gelukt om aan interwiki-link naar https://www.wikidata.org/wiki/Q2674257 aan te leggen. --Arnaudleene (overleg) 13 sep 2021 11:22 (CEST)
Een paar tips
bewerkenEr zijn een paar tips die je vermoedelijk van pas zullen komen bij het toevoegen van nieuwe lemma's.
- In de afbrekingen wordt traditioneel het kleine puntje gebruikt dat je kunt vinden onder het bewerkingsscherm in de sectie "Speciale tekens:", aan het eind van de regel "Diversen:". Als je dat omslachtig vind, kun je in plaats daarvan ook het sjabloon {{syll}} gebruiken: {{syll|af|bre|king}} geeft af·bre·king.
- De betekenisomschrijvingen zijn geen volzinnen en krijgen om die reden geen punt aan het eind. Ze kunnen desnoods door een volzin worden gevolgd als een uitgebreidere omschrijving dat vereist. Om de opmaak niet te verstoren kan dit het beste op een nieuwe regel gebeuren, maar die kan binnen de omschrijving alleen met <br/> worden aangegeven: gewoon op een nieuwe regel beginnen verstoort de opmaak. Ook het wikidatasjabloon kan het beste na <br/> staan, omdat het meestal niet direct in de tekst van de betekenisomschrijving past.
- Een vuistregel is dat een samenstelling (met {{samen}} aan elkaar wordt geschreven (soms met een koppelteken) en een verbinding (met {{coll}} of {{vast}}) uit meerdere woorden bestaat.
- Bij Nederlandse woorden is het altijd een goed idee om de volgende regels mee te nemen, anders is er geen signaal dat het geluidsbestand moet worden aangemaakt.
{{-pron-}} *{{sound}}: {{audio|nl-{{pn}}.ogg|{{pn}}|nld}}
Ik hoop dat je hier voor toekomstige bijdragen wat aan hebt. Ze smaken zeker naar meer! --MarcoSwart (overleg) 14 sep 2021 23:59 (CEST)
- De {{syll}} is een beter idee. Ik heb warschijnlijk nu het verkeerde teken van mijn tostenbord gebruikt. Leek ook wat dikker te zijn.
- OK geen punten aan het eind.
- Ik heb inderdaad een probleem met de nieuwe regel. de break werkt niet lekker als er een voorbeeldtekst onderstaat.
- Wat is vet verschil tussen {{coll}} en {{vast}}. Heb je een voorbeeld?
- OK voor het geluid
- Het toevoegen van de vertaling is wat omslachtig. Ik ben nu regelmatig op zoek naar de drieletter codes. De tweeletters ken ik inmiddels wel uit mijn hoofd. Zal de engelse woordenboek aanpak hiervoor ook voor de nl-versie gebruikt worden?
- De link naar het NL-woordenboek moet ik nog uitzoeken.
Het sjabloon {{coll}} is algemeen bruikbaar. Het heeft wel een taalcode nodig, maar als de paginatitel de goede woorden voor de links bevat, hoef je verder niets op te geven. Daarentegen is {{vast}} specifieker: het werkt alleen voor Nederlandstalige vaste verbindingen tot maximaal 3 woorden. Het heeft dus geen taalcode nodig, maar daar staat tegenover dat het de mogelijkheid biedt om per woord ook de woordsoort op te geven, zodat de link direct op de goede plaats uitkomt, wat handig is bij verwijzingen naar een woord dat in verschillende woordsoorten kan voorkomen.
- {{vast|vz|in|zn|samenwerking|vz}} geeft: vaste verbinding van in (voorzetsel), samenwerking (zelfstandig naamwoord) en met (voorzetsel)
- {{coll|nld|in samenwerking met}} geeft: verbinding van in, samenwerking en met
Voor jouw project kan ik me voorstellen dat het bij een verbinding eenvoudiger is standaard {{coll}} te gebruiken; bewerkers die later constateren dat meer precieze links wenselijk zijn, kunnen die alsnog aanbrengen.
We maken voor de taalkundige beschrijving bewust gebruik van de ISO 639-3 standaard en die kent geen tweelettercodes. Voor websites (bijvoorbeeld die van Wikimedia) zijn tweelettercodes de norm en worden de drielettercodes als aanvulling gebruikt. Ik verwacht niet dat we hier alsnog de Engelse aanpak zullen overnemen. Aannemend dat je de vertalingen uit andere projecten toch al via een editor verwerkt, heb je misschien iets aan ons sjabloon {{convMW-ISO}} dat de Wikimediacodes (merendeels tweelettercodes) omzet in de bijbehorende drielettercodes. Als je dat aanroept met "subst:" kun je tweelettercodes gebruiken en de programmatuur laten zorgen voor de verwerking.
- *{{{{subst:convMW-ISO|es}} }}: wordt na opslaan: *{{spa}}: en dus op de pagina zichtbaar als
- Spaans: (zoals dat in een vertaaltabel hoort).
Ik weet niet zeker wat je met het NL-woordenboek bedoelt: nl.wiktionary, woordenlijst.org, het WNT op ivdnt.org of misschien nog iets anders? Groeten, --MarcoSwart (overleg) 15 sep 2021 16:16 (CEST)
- Ik heb subst geprobeerd, maar dat levert onleesbare pagina's op.
Ik bedoelde de WNT. --Arnaudleene (overleg) 15 sep 2021 18:59 (CEST)
- Zoeken in het WNT kan op deze pagina. Je krijgt dan ook eventuele vindplaatsen in het (Vroeg-)Middelnederlands en Oudnederlands. Als je in die lijst klikt op het gewenste lemma krijg je een pagina met de beschrijving van het woord. In het url van die pagina zit een stukje id= gevolgd door een hoofdletter en een aantal cijfers. Die letter plus cijfers is wat gebruikt wordt door het {{wnt-r}}, dus zonder het stuk na de cijfers (&lemmodern=...). Als het lemma is herzien of aangevuld, worden de cijfers soms weer gevolgd door .re. en nog enkele cijfers die ook meegaan in het sjabloon.
- Ik kan het probleem met subst: inmiddels reproduceren. Het sjabloon convMW-ISO werkt inderdaad iets te complex voor deze oplossing. Ik heb even tijd nodig om na te gaan of er toch een simpele uitweg is. --MarcoSwart (overleg) 15 sep 2021 21:23 (CEST)
- Doe geen moeite. Ik heb inmiddels een lijst met talen in alfabetische volgorde, die ik steeds hergebruik. - De voorgaande niet ondertekende opmerking werd toegevoegd door Arnaudleene (overleg|bijdragen) .
Provençaalse kruiden
bewerkenPast deze in het woordenboek? Omdat het een specifiek kruidenmengsel is? --Arnaudleene (overleg) 17 sep 2021 14:39 (CEST)
- Wat taalkundig verschil maakt is of het echt gaat om kruiden uit de Provence: in dat geval is het een doorzichtige samenstelling. Maar in feite gaat het om een type kruidenmengsel, waarvan onderdelen tegenwoordig helemaal niet uit de Provence afkomstig hoeven te zijn: dan wordt het een soortnaam, waarvan een woordenboek de betekenis kan uitleggen. Een gevolg van deze benadering is wel dat het woord volgens spellingregel 16.H dan ook met een kleine letter wordt geschreven, dus provençaalse kruiden. Er zijn gelukkig ook taalgevoelige schrijvers die deze schrijfwijze al hebben toegepast, zodat het straks goed mogelijk is voorbeeldzinnen toe te voegen. --MarcoSwart (overleg) 18 sep 2021 18:02 (CEST)
Definities uitgebreid of kort
bewerkenWat is het beleid voor definities als er meerdere opties zijn. Kan ik in de tweede definitie verwijzen naar de eerste? Bijvoorbeeld zoals hier: myrtille --Arnaudleene (overleg) 20 sep 2021 11:14 (CEST)
- Met het oog op hergebruik van onze gegevens is het beter als elke omschrijving op zichzelf gelezen kan worden. De verwijzing in het voorbeeld is daarom minder geslaagd. In plaats van [1] zou ik schrijven "planten uit het geslacht Vaccinium "
- Maar als er meer betekenissen worden omschreven, is het niet nodig dat bij elke afzonderlijke betekenis een cyclische omschrijving wordt vermeden of een verduidelijkende toevoeging wordt herhaald. In de andere secties kan wel met nummertjes naar de omschrijvingen worden verwezen.
- Terzijde: in die andere secties beginnen de teksten altijd met een bullet (* aan het begin van de regel in wikitext). Bij sommige sjablonen die per definitie aan het begin van zo'n regel geplaatst moeten worden is die bullet ingebouwd, maar anders is dat het normale begin van de tekst onder een kopje. --MarcoSwart (overleg) 20 sep 2021 11:41 (CEST)
- Ik had het op andere pagina's gezien. Ik zal het repareren als ik het tegenkom. Inderdaad slecht voor hergebruik. --Arnaudleene (overleg) 20 sep 2021 11:55 (CEST)
Paar kleinigheden over woorden in het Frans
bewerkenDag Arnaudleene, heel even over de pagina's met Franse woorden die je bezig bent aan te maken: standaard voegen we hier ook altijd nog Sjabloon:-frnoun- toe (waarin alle enkelvouds- en meervoudsvormen in combinatie met het bepaalde lidwoord zijn te zien). Verder valt me op dat je steeds een omschrijving geeft i.p.v. de letterlijke vertaling; inmiddels heb ik dat laatste ook aangepast. (Zie ter illustratie de pagina's abricotier en myrtille in hun huidige vorm).
Als er toch nog iets onduidelijk is, laat maar weten. Veel succes verder nog. Groet, De Wikischim (overleg) 20 sep 2021 14:52 (CEST)
- Ik was inderdaad in dezelfde stijl als het Nederlandse woordenboek begonnen. Komen de vertalingen er dan niet onder te staan? --Arnaudleene (overleg) 20 sep 2021 15:01 (CEST)
- Nee, in dit geval niet. De pagina myrtille hoort geen echte definitie van de betreffende vrucht te geven, maar alleen de standaardvertaling(en) in het Nederlands. De standaardtabel met vertalingen (zie sjabloon:-trans-) wordt alleen maar gebruikt op de pagina die het Nederlandse woord (in dit geval blauwe bosbes) behandelt.
- Terzijde, ik ga erin mee dat het wat dit betreft niet heel erg eenvoudig is qua basisopzet hier. Maar afijn, je hebt inmiddels toch al best veel door zie ik. Groet, De Wikischim (overleg) 20 sep 2021 15:16 (CEST)
Automatisch genereren?
bewerken- In dit geval lijkt me dat de meeste "vertaal-pagina's" grotendeels automatisch gegenereerd kunnen worden (als ze nog niet bestaan).- De voorgaande niet ondertekende opmerking werd toegevoegd door Arnaudleene (overleg|bijdragen) .
- …wat mijn suggestie hierboven onder Vertalingen bij punt 3 was (en is). --MarcoSwart (overleg) 20 sep 2021 20:32 (CEST)
- Hmm, ik heb toch wat bedenkingen hierbij. Deels automatisch genereren hiervan kan misschien wel, maar toch lijkt het me zeer wenselijk dat iemand de pagina's dan nog eens goed naloopt op inhoudelijke juistheid, syntaxfouten e.d. Een "kettingfout" (die zich in het ongunstige geval over zeer veel pagina's verspreidt) is immers zo gemaakt. De Wikischim (overleg) 20 sep 2021 21:26 (CEST)
- dit geldt ook voor de meervoud en verkleiningen. Er is wellicht een minimale pagina te definieren, die niet gecheckt hoeft te worden. --Arnaudleene (overleg) 20 sep 2021 22:01 (CEST)
- In mijn ervaring is het achteraf nalopen minder doeltreffend dan de gegevens vooraf controleren. Als je eenmaal compleet opgemaakte pagina's ziet, vallen de fouten die je bedoelt vaak nauwelijks meer op. In een "schoon" gegevensbestand zie je vaak eerder dat er iets niet klopt. Voor de lemma's in andere talen zou ik daarom bestanden per taal maken en vergelijken (en soms: verrijken) aan de hand van andere wat grotere wiktionary's en woordenboeken. Voordeel is dat de basisstructuur van die lemma's bijna altijd een stuk eenvoudiger is dan van Nederlandse lemma's, het is wel weer een werkje om ze op de goede plaats te krijgen als een woord in meer talen voorkomt.
- Wanneer ik Nederlandse woorden toevoeg, gebruik ik woordenlijst.org en een paar algoritmes om semi-automatisch meervoud en verkleinwoorden toe te voegen. Marcel coenders doet volgens mij iets vergelijkbaars. Ik neem standaard de woordvorming en de IPA-weergave mee en dan is het zeker nodig om even na te gaan of alles klopt, in zeker een op de tien gevallen is een handmatige aanpassing of aanvulling nodig, maar veruit de meeste tijd gaat zitten in het verzamelen van geschikte vindplaatsen en het formuleren van goede omschrijvingen. Het is in principe wel mogelijk voor deze vormen een minimaal lemma te definiëren dat simpel de gegevens uit woordenlijst.org gebruikt, maar dat werkt wat averechts omdat in de praktijk niemand de moeite neemt de ontbrekende gegevens achteraf toe te voegen: niet handmatig omdat dat een veel te groot karwei is en niet semi-automatisch omdat bestaande pagina's vaak zoveel variatie in opzet kennen, dat het dan nog steeds een te groot karwei is. Ook hier zou ik er dus voorstander van zijn om uit te gaan van een bestand en dat te verrijken voordat er lemma's worden aangemaakt. --MarcoSwart (overleg) 22 sep 2021 13:23 (CEST)
- …wat mijn suggestie hierboven onder Vertalingen bij punt 3 was (en is). --MarcoSwart (overleg) 20 sep 2021 20:32 (CEST)
Vormgeving Wikidatasjabloon
bewerkenMij valt op dat we het Wikidatasjabloon eigenlijk nooit gebruiken voor tekst in een lopende zin. Misschien is het gemakkelijker als het sjabloon standaard een tekst tussen haakjes levert. Hoe kijk jij daar tegenaan? --MarcoSwart (overleg) 20 sep 2021 20:36 (CEST)
- Ik zet het nu steeds tussen haakjes, vind ik er beter uitzien. Mer de break geeft lelijke resultaten. Ik weet niet of het ook anders toegepast wordt. De haakjes zetten is een kleine moeite. --Arnaudleene (overleg) 20 sep 2021 21:58 (CEST)
- Het is een kleine moeite, maar de ervaring leert dat we zulke dingen soms toch vergeten. Verder, als ik het vergelijk met de contextlabels is het minder fraai dat de haakjes niet cursief zijn. Bij de contextlabels hebben we ook gekozen voor het gemak (en de consistentie) van ingebouwde vormgeving. Ik heb nu experimenteel de mogelijkheid van haakjes zetten in het sjabloon ingebouwd. Ik heb lever gebruikt als voorbeeld om het resultaat te tonen. In mijn ogen ziet dit er wat consistenter uit en is zo beter onderscheiden van de omschrijving zelf. Dat laatste was weer de reden om een nieuwe regel te gebruiken. Omdat we nu in een beginfase zitten, is het nog vrij eenvoudig om de verstekwaarde te veranderen, zodat het sjabloon standaard met haakjes verschijnt en de lemma's waarop het sjabloon nu is gebruikt met een bot semi-automatisch aan te passen. Als we daarmee wachten, laat zich voorspellen dat de variëteit in opmaak rond het sjabloon zo groot is geworden dat het alsnog meer standaardiseren een veel lastiger klus wordt. Ik heb de afgelopen jaren een paar van dat type klussen onderhanden gehad en die zijn niet zo leuk. Vandaar mijn neiging om in dit stadium al zoveel mogelijk de puntjes op de i te zetten. --MarcoSwart (overleg) 22 sep 2021 12:40 (CEST)
- Helemaal me eens. Ik ben een voorstander van zoveel mogelijk structuur en dus sjablonen. Ik zou ook graag sjablonen zien voor hypo, hyper, etc. Ik zie nu veel variatie in de vormgeving. --Arnaudleene (overleg) 22 sep 2021 13:43 (CEST)
- Zoals je misschien al hebt gezien is de verstekwaarde voor de vormgeving van het sjabloon nu een cursieve tekst tussen haakjes. Wanneer het de voorkeur heeft om de tekst zonder haakjes in te passen kan de parameter "h=0" worden gebruikt. Ik heb de bestaande lemma's aangepast en de soms voor het sjabloon ingevoegde regeleinde weer verwijderd. --MarcoSwart (overleg) 23 sep 2021 15:57 (CEST)
- Mooi, ik zie dat het al verwerkt is. --Arnaudleene (overleg) 23 sep 2021 16:59 (CEST)
Alfabet: letter ij ?
bewerkenIk heb nog geleerd dat de ij in het Nederlands een aparte letter is. En dus ook bij de Y in het alfabet staat. Is dit nog gebruikelijk?