Hvordan kan BLEU-scoren bruges til at evaluere ydeevnen af en tilpasset oversættelsesmodel, der er trænet med AutoML Translation?

by EITCA Academy / Onsdag 02 August 2023 / Udgivet i Kunstig intelligens, EITC/AI/GCML Google Cloud Machine Learning, Google Cloud AI-platform, AutoML-oversættelse, Eksamensgennemgang

BLEU-scoren er en meget brugt målestok til evaluering af maskinoversættelsesmodellers ydeevne. Den måler ligheden mellem en maskingenereret oversættelse og en eller flere referenceoversættelser. I forbindelse med en tilpasset oversættelsesmodel, der er trænet med AutoML Translation, kan BLEU-score give værdifuld indsigt i kvaliteten og effektiviteten af modellens output.

For at forstå, hvordan BLEU-scoren bruges, er det vigtigt først at forstå de underliggende begreber. BLEU står for Bilingual Evaluation Understudy, og det blev udviklet som en måde til automatisk at evaluere kvaliteten af maskinoversættelser ved at sammenligne dem med menneskeskabte referenceoversættelser. Scoren varierer fra 0 til 1, hvor en højere score indikerer en bedre oversættelse.

AutoML Translation er et kraftfuldt værktøj, der tilbydes af Google Cloud AI Platform, der giver brugerne mulighed for at træne tilpassede oversættelsesmodeller ved hjælp af deres egne data. Når modellen er trænet, kan den bruges til at generere oversættelser til ny inputtekst. BLEU-scoren kan derefter bruges til at vurdere kvaliteten af disse oversættelser.

For at beregne BLEU-scoren sammenlignes de modelgenererede oversættelser med en eller flere referenceoversættelser. Sammenligningen er baseret på n-gram, som er sammenhængende sekvenser af n ord. BLEU-scoren tager ikke kun højde for præcisionen af n-grammene i den modelgenererede oversættelse, men også deres tilstedeværelse i referenceoversættelserne. Dette hjælper med at fange både tilstrækkeligheden og flydende oversættelser.

Lad os illustrere dette med et eksempel. Antag, at vi har en referenceoversættelse: "Katten sidder på måtten." Og modellen genererer følgende oversættelse: "Katten sidder på måtten." Vi kan opdele disse sætninger i n-gram:

Reference: ["den", "katten", "er", "sidder", "på", "den", "måtten"] Model: ["den", "katten", "sidder", "på", "den", "måtte"]

I dette tilfælde oversætter modellen korrekt størstedelen af n-grammene, men den savner verbets tid ("er" vs. "sidder"). BLEU-score ville afspejle dette ved at tildele en lavere score til oversættelsen.

BLEU-scoren kan beregnes ved hjælp af forskellige metoder, såsom den modificerede præcision og korthedsstraf. Den modificerede præcision forklarer, at en oversættelse kan indeholde flere forekomster af et n-gram, mens korthedsstraffen straffer oversættelser, der er væsentligt kortere end referenceoversættelserne.

Ved at evaluere BLEU-score for en tilpasset oversættelsesmodel, der er trænet med AutoML Translation, kan brugerne få indsigt i modellens ydeevne og identificere områder, der kan forbedres. De kan sammenligne BLEU-scorerne for forskellige modeller eller iterationer for at spore fremskridt og træffe informerede beslutninger om modelvalg eller finjustering.

BLEU-scoren er en værdifuld metrik til at evaluere ydeevnen af tilpassede oversættelsesmodeller, der er trænet med AutoML Translation. Det giver et kvantitativt mål for kvaliteten af maskingenererede oversættelser ved at sammenligne dem med referenceoversættelser. Ved at analysere BLEU-scoren kan brugerne vurdere effektiviteten af deres modeller og træffe datadrevne beslutninger for at forbedre oversættelseskvaliteten.

Andre seneste spørgsmål og svar vedr AutoML-oversættelse:

Flere spørgsmål og svar:

Mark: Kunstig intelligens
program: EITC/AI/GCML Google Cloud Machine Learning (gå til certificeringsprogrammet)
Lektie: Google Cloud AI-platform (gå til relateret lektion)
Emne: AutoML-oversættelse (gå til relateret emne)
Eksamensgennemgang

Tagged under: Kunstig intelligens, AutoML-oversættelse, BLEU-score, Evalueringsmetrik, Google Cloud AI-platform, Maskinoversættelse

EITCA Academy

Hvordan kan BLEU-scoren bruges til at evaluere ydeevnen af en tilpasset oversættelsesmodel, der er trænet med AutoML Translation?

Andre seneste spørgsmål og svar vedr AutoML-oversættelse:

Flere spørgsmål og svar:

EITCA Academy er en del af den europæiske IT-certificeringsramme

Berettigelse til EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Academy

Log ind på din konto af enten dit brugernavn eller e-mail-adresse

FORGÅ DIN DETALJER?

OPRET EN KONTO

Hvordan kan BLEU-scoren bruges til at evaluere ydeevnen af ​​en tilpasset oversættelsesmodel, der er trænet med AutoML Translation?

Andre seneste spørgsmål og svar vedr AutoML-oversættelse:

Flere spørgsmål og svar:

Berettigelse til EITCA Academy 80% EITCI DSJC Subsidie ​​support

Hvordan kan BLEU-scoren bruges til at evaluere ydeevnen af en tilpasset oversættelsesmodel, der er trænet med AutoML Translation?

Berettigelse til EITCA Academy 80% EITCI DSJC Subsidie support