◈ 학습사전 기능 활용에 대해서
“진화형 번역지원도구”는 ‘기본어 사전’, ‘전문 용어사전’ 그리고 사용자 사전 말고도 학습사전이라는 또 하나의 사전 기능이 있습니다. “진화형 번역지원도구”에서 학습사전 기능은 없어선 안 되는 또 하나의 중요한 기능입니다.
사용자 사전이 주로 새로운 단어 정보, 전문지식 등을 단어 개념으로 새롭게 학습시키는 것이라면, 학습사전은 엄밀히 사전 이라기보다는 번역기가 이미 갖고 있는 사전에서의 단어의 의미 정보 중, 사용자에게 필요한 번역 범주 분야에 맞는 적절한 뜻을 사용자가 선택해, 그 우선순위를 지정해 주고, 동시에 번역엔진의 성능을 튜닝해주어 이를 번역기에게 학습시켜가게 하는 기능을 말합니다.
1) 단어 의미의 교체: 번역기가 뿌려 준, 1차 번역 결과에서 뜻이 잘못 쓰인 단어가 있을 때, 해당단어를 더블클릭하면 그 단어가 지닌 모든 사전정보 리스트가 나옵니다. 이때, 나열된 다른 모든 의미 정보에서 가장 적절한 뜻을 선택해 그릇된 번역 결과를 바로잡아 주는 기능입니다.
2) 품사의 재지정: 한 단어에 동사나 명사, 형용사 속성이 모두 들어 있어, 그 단어가 경우에 따라 달리 사용되는 경우에 잘못 쓰인 속성을 바로잡아 주는 기능을 할 수 있습니다. 동사나 명사로 어떻게 쓰였느냐에 따라 그 단어가 든 문장의 내용은 크게 변화할 수 있습니다. 학습사전은 이를 조정해주는 기능입니다.
3) 같은 품사 내에서의 속성 재지정: 학습사전에서 같은 동사라도 과거형 동사나 형용사 속성의 분사형 동사 등 다양한 의미로 사용되는 단어들을 사용자가 의도하는 의미 우선순위를 학습시킬 수 있습니다. 이 또한 문장의 구조를 변화시키는 주요한 동기가 됩니다.
4) 특정 단어의 용도에 대한 학습의 지정과 해제, 재지정 등을 임의롭게 할 수 있어 번역기의 번역 결과뉘앙스를 다듬어 가게 하는 세부적인 기능으로, 번역엔진의 튜닝을 해가게 하는 중요 기능. 이를 별도의 사전처럼 용도별로 학습사전 파일을 생성해 그때그때, 번역 범주에 따라 그것들을 재활용하는 기능이 바로 학습사전 기능이다.
뉴스인지, 해설인지, 매뉴얼인지 각기 문장 속성에 따라서 주로 쓰이는 단어들에 대해서 세심한 교정을 해주고, 이를 각기 사전형태로 관리하며 언제든 이를 다시 꺼내 활용하면서, 번역기의 성능 자체를 변화시켜가게 하는 “진화형 번역지원도구”만이 갖는 중요한 기능 중 하나입니다.
가령, ‘메이저리그경기학습사전’, ‘메이저리그스토브리그학습사전’, ‘메이저리그해설분석학습사전’ 등 다양한 자신만의 학습사전을 만들 수 있습니다. 게임과 경기분석, 해설 그리고 선수 스카우트 기사가 넘치는 스토브리그 의 원문은 제 각각 문장 속성이 다르기 때문에, 정교하게 자신만의 학습사전을 만들어 학습시켜 갈수록 번역기의 그 효용은 더욱 높아지게 될 것입니다.
재미있는 것은 이 학습사전과 비슷한 명칭을 가진 기능들을 여타의 다른 고정성 엔진의 자동번역기에도 역시 갖고 있다는 것입니다. 하지만 부지런히 단어 수정을 하고 난 뒤, 프로그램을 잠시 꺼보면, 기껏 단어 뜻을 ‘대체’해 놓았더니 어디론가 날아가 버렸을 것입니다.
고정성 번역엔진개념에서의 번역기가 갖고 있는 이름만 비슷한 이 기능들은, 번역S/W를 학습시켜 그 번역기의 성능을 꾸준히 높여가게 하는 진정한 학습사전이라고 할 수는 없습니다.
이제 예문들을 따로 보여드리면서 에버트란의 “변용성 번역지원도구”가 지닌 그 차별성을 좀 더 설명하도록 하겠습니다.
① 학습사전기능 활용 예문(품사 속성의 재지정)
☞ 원문: align mount hole and secure aim with knob assembly.
1차 기계번역 결과: 오르기 구멍. 그리고 고정되는 목표를 노브 조립체와 정렬시키십시오.
(기계 조작에 관한 분야 예문으로, 기계전문 용어사전을 쓴 조건에서 아래와 같은 결과가 나왔다. 물론 기본적으로 번역기 안의 해당 단어 정보는 형용사와 동사의 정보가 함께 들어 있다. )
자동번역기가 특별한 범주나 조건을 설정하지 않았을 때, 일반적인 품사 선택은, 기계의 최선에 의한 품사를 선택할 것이다. 그러나 그것이 언제나 정교할 수 만은 없는 것이 기계의 특성이기도 한 것이다.
여기서 secure는 형용사가 아니라, 동사로 인식되는 것이 맞으므로 동사로 지정을 해주었다. 기계 매뉴얼 조작에 관한 내용 속성을 감안한다면, secured 라는 분사형태의 형용사로 쓰인다면 몰라도, 거의 동사로 그 의미가 주어진다고 볼 수 있다. 이 단어를 학습사전에서 품사속성 재지정을 시켜 기억시켜놓는다면, 적어도 이 예문이 담긴 범주에서는 동사로 고정해 두어도 무방한 단어가 될 것이다. 그리고 이를 학습시킨 ‘공작기계다루기(예)’ 라는 명칭으로 생성해 놓은 학습사전을 적용할 수 있다.
2차 학습번역 결과: 오르기 구멍을 정렬시키십시오. 그리고 목표를 노브 조립체로 고정하십시오.
이미 뿌려준 번역결과에서 잘못된 품사 정보를 재조정해주고 이를 다시 학습시켜놓는 학습사전만의 고유한 특징은 “변용성 번역지원도구”만이 가질 수 있는 특징적 기능이다.
② 학습사전기능 활용 예문(의미의 재조정)
☞ 원문: The copyright law of each country governs the reproduction of copyrighted works.
1차 기계번역 결과: 각 국가의 저작권법은 저작권으로 보호된 제작품의 복제품을 다룹니다.
(법률에 관련된 위 예문을 번역하기 위해, 기본어 사전과 법률전문 용어사전을 써서 번역기를 처음 돌렸더니, 다음과 같은 번역 결과가 나왔다.)
자동번역기가 특별한 범주나 조건을 설정하지 않았을 때, 일반적인 의미의 선택은 기계의 최선에 의해 내용이 지정될 것이다. 이 역시 언제나 정교할 수 만은 없는 것이 기계의 특성이기도 한 것이다.
govern이라는 동사를 좀 더 다듬기 위해 단어정보를 나열 시켜보면 ‘지배하다’, ‘통치하다’, 관리하다, ‘적용하다’,결정하다’ … 등등의 의미가 나온다. 나열된 정보 가운데에서 적합한 의미정보를 선택하여 이를 학습시킬 수 있다.
2차 학습번역 결과: 각 국가의 저작권법은 저작권으로 보호된 제작품의 복제품에 적용됩니다.
사용자 입장에서 해당 단어가 이 분야에서 쓰이는 빈도가 많은 주요 단어라고 여겨진다면, 그 의미를 아예 지정해 놓는 것이 번역기 성능을 조금이라도 더 높아지게 만들어가는 작업이 된다. 그리고 ‘저작권관련법조문(예)학습사전’ 이라는 명칭으로 만든 자신만의 학습사전을 만들어 놓고 필요에 따라 언제든 이 학습사전을, 비슷한 범주의 다른 원문에 적용하며 사용해 갈 수 있다.
③ 학습사전기능 활용 예문(같은 품사 내에서의 속성 재지정)
☞ 원문: If you do not have a USB 2.0 card installed, this CD-RW drive will still work connected to a standard USB 1.1 connection, but the speed will be limited to USB 1.1 speed.
1차 기계번역 결과: 만일 카드가 설치했던, 이 CD-RW 드라이브가 여전히 작동할 것인 USB 2.0을 표준 USB 1.1에 연결하게 하지 않으면 커넥션 그러나 속도는 USB 1.1의 속도에 제한될 것입니다.
(IT 분야 예문으로, IT전문 용어사전을 쓴 조건에서 아래와 같은 결과가 나왔다.)
자동번역기에 특별한 범주나 조건을 설정하지 않았다면, 기계는 일반적인 품사 속성에 대해 주변 단어와의 최선의 조합에서 찾아 그 의미를 결정한다. 그러나 기계적인 한계엔 역시 만족하지 못할 결과 변수가 나타날 수 있다.
“변용성 번역지원도구” 에서는 번역기의 성능을 높여가기 위하여 다양한 학습기능을 복합적으로 활용해 가야 한다. 이것은 같은 분사형 동사라도 그 활용과 의미에 따라 하나는 사용자 사전으로 또 다른 하나는 학습사전에서 학습을 시킨 예문이다. 형용사 속성으로 쓰인 분사는 수식하는 명사와 함께 복합명사구로 USB 2.0 card installed(설치된 USB 2.0 카드)로사용자사전에 새 단어로 학습시키고, 후자 connected는 그냥 분사로 학습사전 기능 속에서 그 의미 속성을 지정해주었다.
2차 학습번역 결과: 만일 설치된 USB 2.0 카드를 가지지 않으면, 표준 USB 1.1의 커넥션에 연결된 이 CD-RW 드라이브는 여전히 작동할 것입니다. 그러나 속도는 USB 1.1의 속도에 제한될 것입니다.
복잡한 기능쯤으로 여기고 학습사전의 활용을 포기한다면, 보다 정교한 번역엔진으로의 학습은 어려울 것이다. 경험과 시간을 투자하는 만큼 자동번역기의 성능은 향상되는 것이다.
서비스 신청