You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Objectiu: Avaluar qualitat del corpus de Wikimatrix
El corpus de Wikimatrix va ser alineat automàticament per Facebook i contenia un 30% de frases en les quals el català no es corresponia amb el anglès o la traducció era de qualitat baixa.
Mètrica: % de frases incorrectes en una selecció de 300 frases aleatòria del corpus
Agafar 300 frases aleatòriament del corpus ja processat de Wikimatrix. Fitxers: WikiMatrix.en-ca.txt.ca i WikiMatrix.en-ca.txt.en al directori /preprocessed
Posar-les en un full de càlcul
Avaluar amb el nostre ciriteri humà si la traducció és prou bona o no
Si el % que obtenim de frases incorrectes superior a un 5% vol dir que hem de pensar com continuar netejant el corpus
The text was updated successfully, but these errors were encountered:
Objectiu: Avaluar qualitat del corpus de Wikimatrix
El corpus de Wikimatrix va ser alineat automàticament per Facebook i contenia un 30% de frases en les quals el català no es corresponia amb el anglès o la traducció era de qualitat baixa.
Mètrica: % de frases incorrectes en una selecció de 300 frases aleatòria del corpus
Ara mateix el que fem és:
https://github.com/Softcatala/nmt-softcatala/blob/master/training-sets/eng-cat/preprocess.sh#L11
Com:
Si el % que obtenim de frases incorrectes superior a un 5% vol dir que hem de pensar com continuar netejant el corpus
The text was updated successfully, but these errors were encountered: