WikiWoordenboek:Woordenboek populair Frans - Nederlands
De schrijver en uitgever van het "Woordenboek populair Frans - Nederlands", Berry van de Wouw, verklaarde zich op de Wikimediaconferentie Nederland 2017 bereid om de inhoud van dit woordenboek met ongeveer 5.000 lemma's en 30 illustraties, aan WikiWoordenboek te doneren. Het betrof een degelijke verzameling van hedendaagse Franse spreektaal (argot) met een behoorlijk aantal voorbeeldzinnen. Deze donatie heeft vorm gekregen door voor de tweede druk van dit boek een CC-BY-SA 4.0 licentie af te geven en het pdf-bestand op Commons te zetten (zie rechts).
Deze pagina beschrijft de verwerking van deze donatie in WikiWoordenboek. Deze is in hoofdzaak voltooid, maar zoals altijd op WikiWoordenboek: uitbreiding en verbetering blijven natuurlijk altijd mogelijk. Om deze pagina leesbaar te houden, kunnen vragen en commentaar beter op de Overlegpagina worden gezet. Zij zijn overigens van harte welkom, net als WikiWoordenaars - liefst met kennis van het (hedendaagse) Frans - die willen helpen met bijvoorbeeld:
- het toevoegen van ontbrekende woorden waarnaar wordt verwezen
- aanvullende betekenisomschrijvingen: er zijn nu heel wat toegevoegde lemma's die wel de betekenis in argot, maar niet die in standaardtaal geven.
Hoewel onderstaande tekst in de tegenwoordige tijd staat, zijn de beschreven werkzaamheden inmiddels afgerond.
Inhoud
bewerkenTe verwerken
bewerken- De lemma's bevatten over het algemeen informatie die ook goed in WikiWoordenboek past: woorden of frases met een bondige omschrijving van de betekenis(-sen), in een groot aantal gevallen nog gevolgd door een vertaalde voorbeeldzin.
- De eerste indruk is dat het voor het grootste deel gaat om woorden en frases die nieuw moeten worden toegevoegd, maar er zijn ook een behoorlijk aantal gevallen waarin het eerder gaat om het toevoegen van een betekenis aan een bestaand lemma. Zuivere overlap komt weinig voor.
- Bij een groot aantal lemma's wordt ook verklarende informatie gegeven die op WikiWoordenboek onder het hoofdje {{-etym-}} hoort.
- Zoals te verwachten valt, zitten er ook de nodige scabreuze termen in het bestand, maar over het algemeen hebben wij de corresponderende Nederlandstalige lemma's ook al. Bij de sms-taal kan dat meer problemen opleveren.
- Sommige woorden die voor het opzoeken tweemaal in het woordenboek zijn opgenomen hebben op de onderscheiden vindplaatsen verschillen in de betekenisomschrijving of voorbeeldzinnen. Het beste uitgangspunt lijkt om in dat geval de informatie van verschillende plaatsen bij elkaar te zetten en die alleen weg te laten als het echt niets toevoegt.
Nu toe te voegen
bewerken- Het belangrijkste wat binnen de lemma's ontbreekt is de woordsoort, die bij opname nog moet worden toegevoegd. Doordat via vermelding van het lidwoord le of la het woordgeslacht is aangegeven, zijn veel zelfstandige naamwoorden vrij gemakkelijk te herkennen.
- Naar de aard van de bron zal aan de omschrijvingen veelal het contextsjabloon {{spreektaal}} moeten worden toegevoegd. Bij woorden met de aanduiding "sms-taal" zal het iets algemenere label {{chattaal}} worden toegevoegd.
- In Frans slang worden nieuwe varianten van een woord gemaakt door in de uitspraak het laatste deel aan het begin te zetten. Het lijkt de moeite waard om voor dit verlan een specifiek Frans contextsjabloon {{verlan}} met bijbehorende beschrijvende pagina en Categorie:Verlan te maken.
- Zoals bij veel gedrukte woordenboek is soms ruimte bespaard door verschillende schrijfwijzen met behulp van een schuine streep in één lemma te beschrijven. Op WikiWoordenboek horen die op verschillende pagina's, waarbij het mogelijk is om identieke omschrijvingen te gebruiken. Het is wenselijk dat deze lemma's met behulp van {{-writ-}} naar elkaar verwijzen.
- Met het oog op de alfabetisering is bij sommige frasen met behulp van een komma de volgorde aangepast. Voor de plaatsing in WikiWoordenboek moet de 'gewone' volgorde weer hersteld worden. Deze frasen zijn zo ook vaak meermaals onder verschillende trefwoorden opgenomen. Dit is voor WikiWoordenboek niet nodig. Het is wel nuttig om vanaf al die woorden naar het lemma te linken. Dit vereist enige bewerkingen van het bronmateriaal.
- In het algemeen is het wel nuttig om na te gaan vanaf welke bestaande lemma's naar de nieuwe frasen kan worden gelinkt.
- Naast compleet nieuwe lemma's, zijn er ook gevallen waarin bestaande lemma's worden uitgebreid met een specifieke betekenis. Bij het maken van sjablonen voor bronvermelding is het daarom handig twee varianten te hebben.
- Een aandachtspunt zijn kleine verschillen tussen de vorm van een woord, afhankelijk van de vraag of het om een man of een vrouw gaat.
- Als de mannelijke en vrouwelijke vorm verschillend worden geschreven, hoort dat in WikiWoordenboek lemma's op twee verschillende pagina's op te leveren. Het is natuurlijk wel wenselijk dat die naar elkaar verwijzen. Vaak zal dat op twee manieren gebeuren: morfologisch onder {{-etym-}}, vaak met {{|Tl|suff}} en semantisch onder {{-rel-}} met {{f-form}} en {{m-form}}.
- Als het zowel in het Frans als Nederlands om één vorm gaat, waarbij alleen in het Frans het verschil met het lidwoord wordt aangegeven gebruiken we op WikiWoordenboek één lemma met genus "m en v".
- Als het verschil in lidwoord ook gepaard gaat met een andere vertaling in het Nederlands kan het lemma beter worden gesplitst in twee onderdelen (onder dezelfde woordsoort).
- Sommige lemmawoorden bevatten onderdelen als se/s' of quelqu'un/quelque chose. Op WikiWoordenboek maken die vanwege de opzoekbaarheid standaard geen deel uit van paginatitel/lemmawoord.
Niet nu toe te voegen
bewerkenHet toevoegen van onderstaande informatie is een stevige klus, terwijl die ook op bestaande lemma's vaak nog ontbreekt. Aangezien deze aanvulling ook naderhand nog goed kan gebeuren, wordt dit nu niet bij het overzetten gedaan.
- Informatie over de uitspraak.
- Afbreking.
- Flexie.
Vorm
bewerken- Net zoals we bij Sofeer hebben gedaan, kunnen we op de betreffende lemma's naar het woordenboek verwijzen. Hiervoor zijn twee specifieke bronsjablonen gemaakt: {{Woordenboek populair Frans-Nederlands}} en {{PopFra-r}}.
- De illustraties zijn cartoons die het idioom visueel ondersteunen. Ook de tekenaar stemt ermee in om zijn werk onder CC-BY-SA 4.0 beschikbaar te stellen. Ze kunnen op de betreffende lemma's worden overgenomen. Qua formaat komen ze op WikiWoordenboek nog altijd goed tot hun recht. De tekeningen staan bij elkaar in een categorie op Commons.
- Om een idee te geven hoe het resultaat eruit gaat zien, zijn er een paar voorbeeldlemma's aangemaakt:
Werkwijze
bewerken- [voltooid] Met de schenker (on-)mogelijkheden verkennen.
- [voltooid] Project via De kroeg voorleggen voor reacties en vragen.
- [voltooid] Uitgaande van het Wordbestand nagaan in hoeverre hieruit een aantal gestructureerde bestanden met lemma's zijn af te leiden die met behulp van AutoWikiBrowser vrij eenvoudig zijn over te zetten. De resterende lemma's zullen meer handwerk zijn. Het bleek een betere volgorde om eerst kleine reeksen lemma's met handwerk te realiseren en gesteund door zo opgedane ervaringen geleidelijk naar grotere, meer geautomatiseerde series toe te werken.
- [voltooid] Zowel voor tekst als illustraties zorgen dat duidelijkheid over beschikbaarheid onder vrij licentie duidelijk komt vast te liggen.
- [voltooid] Sjablonen en categorieën aanmaken voor bron en verlan: {{PopFra-r}}, {{verlan}}.
- [voltooid] Toevoegen van woordsoortcodes aan de lemma's.
- [voltooid] Lemma's die gesplitst moeten worden selecteren
- [voltooid] Onderlinge verwijzingen tussen gesplitste lemma's toevoegen
- [voltooid] Woorden in etymologie en omschrijving waar zinvol uitvoeren als link en rode links toevoegen aan Gevraagd materiaal
- [voltooid] Markeren van lemmawoord in voorbeeldzinnen
- [voltooid] Feitelijk invoeren aanvullingen bestaande pagina's
- [voltooid] Feitelijk invoeren van nieuwe pagina's
- [voltooid] Toevoegen van de afbeeldingen aan corresponderende lemma's