• Nebyly nalezeny žádné výsledky

Kombinování překladových systémů

N/A
N/A
Protected

Academic year: 2022

Podíl "Kombinování překladových systémů"

Copied!
32
0
0

Načítání.... (zobrazit plný text nyní)

Fulltext

(1)

Prezentace pro doktorandský seminář

3. listopadu 2009

Kombinování

překladových systémů

Martin Popel

(2)

Kombinování překladových (MT) systémů

Způsoby využití

Různé způsoby kombinace

Dva konkrétní přístupy

Confusion networks

Joint optimization

(3)

Způsoby využití

Systém A

Zdrojový text Systém B Systém C Systém D

Překlad A Překlad B Překlad C Překlad D

Kombinace Výsledný překlad

(4)

Způsoby využití

jeden zdroj vs. více zdrojů

Systém A

Zdrojový text Systém B Systém C Systém D

Překlad A Překlad B Překlad C Překlad D

Kombinace Výsledný překlad

Systém A Jazyk 1

Systém B Systém C Systém D

Překlad A Překlad B Překlad C Překlad D

Kombinace Výsledný překlad Jazyk 2

Jazyk 3 Jazyk 4

(5)

Způsoby využití

jeden zdroj vs. více zdrojů

Systém A Systém B Systém C Systém D

Překlad A Překlad B Překlad C Překlad D

Kombinace Výsledný překlad

Systém A Systém B Systém C Systém D

Překlad A Překlad B Překlad C Překlad D

Kombinace Výsledný překlad

(6)

Způsoby využití

n-best lists

Systém A

Věta 1 (váha 0,4) Věta 2 (váha 0,3) Věta 3 (váha 0,2) Věta 4 (váha 0,1)

Kombinace Výsledná věta

(7)

Způsoby využití

obecný případ

Systém B

Věta A4 (váha 0,1) Věta B1 (váha 0,003) Věta B2 (váha 0,0001) Věta B3 (váha 0,00001)

Kombinace Výsledná věta

Systém C

Věta C1 (váha 0,99) Věta C2 (váha 0,98) Věta C3 (váha 0,95) Věta C4 (váha 0,92) Systém A Věta A1 (váha 0,4)

Věta A2 (váha 0,3) Věta A3 (váha 0,2)

(8)

Způsoby kombinace

Jak dlouhé segmenty textu?

Věty

Fráze

Slova

Systém A Systém B Výsledek kombinace

Věta A1 Věta B1

Věta A2 Věta B2

Věta A3 Věta B3

Systém A Systém B Výsledek kombinace

Věta A1 Věta B1 Věta B1

Věta A2 Věta B2 Věta A2

Věta A3 Věta B3 Věta B3

Systém A Systém B Výsledek kombinace

Věta A1 Věta B1

Věta A2 Věta B2

Věta A3 Věta B3

(9)

Způsoby kombinace

Jak dlouhé segmenty textu?

Věty

jednodušší

zarovnání po větách se předpokládá už na vstupu

Fráze a slova

Zarovnání po slovech (frázích)

Volba slovosledu (pořadí frází)

Volba slov (frází)

(10)

Způsoby kombinace

Dělení dle Schroeder et al (2009)

Věty „Output Selection“

jednodušší

zarovnání po větách se předpokládá už na vstupu

Fráze a slova „Output Combination“

Zarovnání po slovech (frázích)

Volba slovosledu (pořadí frází)

Volba slov (frází)

(11)

Způsoby kombinace

Dělení dle Schroeder et al (2009)

„Output Selection“

„Input Combination“ „Output Combination“

Systém Jazyk 1

Kombinace všech zdrojů do jedné

reprezentace Výsledný překlad

Jazyk 2 Jazyk 3 Jazyk 4

Confusion network

(12)

Způsoby kombinace

Čím se zabývat dál?

„Output Selection“

„Input Combination“ „Output Combination“

Malý potenciál !

(13)

Způsoby kombinace

Čím se zabývat dál?

„Output Selection“

„Input Combination“ „Output Combination“

(Rosti et al, 2007) Malý potenciál !

Word-level system combination outperforms

sentence re-ranking methods.

(14)

Způsoby kombinace

Čím se zabývat dál?

„Output Selection“

„Input Combination“ „Output Combination“

(Rosti et al, 2007) (Schroeder et al, 2009)

Malý potenciál !

The potential is high... Word-level system combination outperforms

sentence re-ranking methods.

(15)

Způsoby kombinace

Čím se zabývat dál?

„Output Selection“

„Input Combination“ „Output Combination“

(Rosti et al, 2007) (Schroeder et al, 2009)

Malý potenciál !

The potential is high...

… ale výsledky zatím horší než při

output combination.

Word-level system combination outperforms

sentence re-ranking methods.

(16)

Output combination

dva přístupy

Confusion networks 1. zarovnání slov

2. volba slovosledu 3. lexikální výběr

Word-level system combination based on confusion networks

outperforms

sentence re-ranking methods.

Joint optimization

(17)

Output combination

dva přístupy

Confusion networks 1. zarovnání slov

2. volba slovosledu 3. lexikální výběr

Joint optimization approach significantly outperforms confusion-network-based

systems.

Word-level system combination based on confusion networks

outperforms

sentence re-ranking methods.

Joint optimization

(He and Toutanova, 2009)

1. + 2. + 3.

(18)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog. váha(1) = 0,4 h2 It is dog of mine. váha(2) = 0,3 h3 This are my dog. váha(3) = 0,2 h4 It is our dog. váha(4) = 0,1

H = {h1, h2, h3, h4}

h1 = {h1,1, h1,2, h1,3, h1,4} = {this, is, a, dog}

h1 = {h2,1, h2,2, h2,3, h2,4, h2,5} = {it, is, dog, of, mine}

(19)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog

h2 It is dog of mine h3 This are my dog

h4 It is our dog

(20)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog

h2 It is dog of mine h3 This are my dog

h4 It is our dog

h1 This is a dog h2

h3 This are my dog h4

(21)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog

h2 It is dog of mine h3 This are my dog

h4 It is our dog

h1

h2 It is dog of mine h3 This are my dog

h4

(22)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog

h2 It is dog of mine h3 This are my dog

h4 It is our dog

h1 h2

h3 This are my dog h4 It is our dog

(23)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog ε

h2 It is dog of mine h3 This are my dog ε

h4 It is our dog ε

(24)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog ε

h2 It is dog of mine h3 This are my dog ε

h4 It is our dog ε

h1 This is a dog ε h2 It is mine dog of h3 This are my dog ε h4 It is our dog ε

CS1 CS2 CS3 CS4 CS5

CS = correspondence set

(25)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog ε

h2 It is dog of mine h3 This are my dog ε

h4 It is our dog ε

h1 This is a dog ε h2 It is mine dog of h3 This are my dog ε h4 It is our dog ε

CS1 CS2 CS3 CS4 CS5

C = {CS1, CS2, CS3, CS4, CS5} CS1 = CS(1, 1, 1, 1)

CS2 = CS(2, 2, 2, 2) CS3 = CS(3, 5, 3, 3) CS4 = CS(4, 3, 4, 4) CS5 = CS(0, 4, 0, 0)

(26)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog ε h2 It is mine dog of h3 This are my dog ε h4 It is our dog ε

CS1 CS2 CS3 CS4 CS5 This is a ε

mine dog

It are my of

↑ confusion network ↑

↓ corespondence sets ↓

(27)

Confusion networks

1. zarovnání slov 2. volba slovosledu 3. lexikální výběr

h1 This is a dog.

h2 It is dog of mine.

h3 This are my dog.

h4 It is our dog.

h1 This is a dog ε h2 It is mine dog of h3 This are my dog ε h4 It is our dog ε

CS1 CS2 CS3 CS4 CS5 This is a ε

mine dog

It are my of

↑ confusion network ↑

↓ corespondence sets ↓

(28)

Joint optimization

Log-lineární model

w – posloupnost slov C – množina CS

O – pořadí CS

H – množina vstupních hypotéz α – vektor vah

f – features

best = argmax

w ,O ,C

α

i

f

i

w ,O ,C , H

(29)

Joint optimization

features

Tri-gram language model

Bi-gram voting model

Word posterior model

Distortion model

Alignment model

a další (počet slov, počet CS)

(30)

Otevřené otázky

Využití faktorizovaných modelů

např.

Odolnost vůči přidání méně kvalitních překladových systémů

Jak trénovat váhy systémů, aby přidání dalších nikdy neuškodilo?

Systém A

Lepší lexikální výběr

Gramatická shoda dodržena pouze u častých n-gramů

Systém B

Horší lexikální výběr Gramatické věty

(31)

Shrnutí

Využití: více systémů, více zdrojů, n-best lists

Druhy kombinací

po větách, po frázích, po slovech

použitelné:

pro jakékoli systémy (black-box MT)

šité na míru konkrétnímu MT systému

Confusion network přístup

1. zarovnání slov, 2. slovosled, 3. lexikální výběr

Joint optimization přístup

kroky 1.,2.,3. prováděny naráz, jeden log-lineární model

(32)

Literatura

Josh Shroeder, Trevor Cohn, Philipp Koehn:

Word Lattices for Multi-Source Translation Proceedings of EACL, 2009

Xiadong He, Kristina Toutanova:

Joint Optimization for Machine Translation System Combination

Proceedings of EMNLP, 2009

Antti-Veikko I. Rosti et al.:

Combining Outputs from Multiple Machine Translation Systems

Proceedings of NAACL, 2007

Odkazy

Související dokumenty

1) “input”: aggregate word/sent + regex embeddings (at sentence level for intent, word level for slots) 2) “network”: per-label supervised attentions. (log loss for

Čtvrtek (Cisco) - Společnost Cisco dnes oznámila, že Bright House Networks, šestý největší provozovatel kabelových systémů ve Spojených státech, nasadí pro

Cross-sectional and time series data are one-dimensional, special cases of panel data. Pooling independent cross-sections: (only) similar to

It is obligatory to neither fill in the Public Health Passenger Locator Form prior to the entry, nor to undergo an antigen or RT-PCR test prior or after the entry. ► Obligation to

Sentenced based combination or in other terms sentence re-ranking techniques are based on choosing the best sentence among the outputs of participating systems,

In Prague Bulletin of Mathematical Linguistics - Special Issue on Open Source Machine Translation Tools,. number 93 in Prague Bulletin of

We then translate each sentence arranged according to each of the word order predictions using a standard phrase-based machine translation system trained on the corpus produced by

• DRESS, or drug-induced hypersensitivity syndrome (DiHS), is a severe adverse drug reaction characterized by fever, generalized skin eruption, lymphadenopathies, eosinophilia,