シラバス参照 |
科目一覧へ戻る | 2019/08/20 現在 |
科目名(和文) /Course |
言語横断情報アクセス |
---|---|
科目名(英文) /Course |
Cross-Lingual Information Access |
時間割コード /Registration Code |
81A14601 |
学部(研究科) /Faculty |
情報系工学研究科 博士後期課程 |
学科(専攻) /Department |
システム工学専攻 |
担当教員(○:代表教員)
/Principle Instructor (○) and Instructors |
○磯崎 秀樹 |
オフィスアワー /Office Hour |
磯崎 秀樹(月曜4限) |
開講年度 /Year of the Course |
2017年度 |
開講期間 /Term |
前期 |
対象学生 /Eligible Students |
1年,2年,3年 |
単位数 /Credits |
2 |
更新日 /Date of renewal |
2017/03/27 |
---|---|
使用言語 /Language of Instruction |
日本語 |
オムニバス /Omnibus |
該当なし |
授業概略と目的 /Cource Description and Objectives |
インターネット上には大量の文書が存在するが、そのうち、日本語の文書はごくわずかであり、その内容も偏っている。 例えば、最先端の科学技術に関する情報のほとんどは英語であり、日本語になっているものはごく限られている。 したがって、日本語の言葉を入力して、関連する英語の文書を見つけることができれば、便利である。 これを言語横断情報アクセスという。 最近は翻訳ソフトの性能が劇的に向上しているので、昔に比べると、言語の壁を感じることは少なくなってきた。 この授業では、翻訳ソフトの性能が、RBMT, SMT, NMT という技術の段階を経て向上したこと、 それぞれの技術にはどんな限界があり、どのように解決されていったかを学ぶ。 |
履修に必要な知識?能力?キーワード /Prerequisites and Keywords |
条件付き確率やパーセプトロンに関する知識 |
履修上の注意 /Notes |
なし。 |
教科書 /Textbook(s) |
SMT については、渡辺太郎ほか: 『機械翻訳』 コロナ社(貸与します)を使う。 NMT については、資料を配布する。 |
参考文献等 /References |
なし。 |
自主学習ガイド /Expected Study Guide outside Coursework/Self-Directed Learning Other Than Coursework |
SMTやNMTのソフトウェアの中には公開されているものがある。 ダウンロードして使い、ソースコードを読うことにより、より深く理解することができる。 |
資格等に関する事項 /Attention Relating to Professional License |
なし。 |
備考 /Notes |
なし。 |
No. | 単元(授業回数) /Unit (Lesson Number) |
単元タイトルと概要 /Unit Title and Unit Description |
時間外学習 /Preparation and Review |
配布資料 /Handouts |
---|---|---|---|---|
1 | 1--2 | [言語横断検索] インターネット上には、大量の英語の文書があるが、日本人は英語が苦手なため、その情報にアクセスするのに苦労する。 そこで、日本語の言葉を入力して、英語の文書を検索できるようにするのが「言語横断検索(CLIR)」である。その実現方法について学ぶ。 |
||
2 | 3--4 | [言語横断質問応答] 日本語で質問をして、英語の文書の中からその答をピンポイントで探し出す「言語横断質問応答システム(CLQA)」の実現方法について学ぶ。 |
||
3 | 5--6 | [ルールベース機械翻訳] 昔は翻訳するためのソフトウェアをゼロから人間が書いていた。これを「ルールベース機械翻訳(RBMT)」という。その仕組みについて学ぶ。 |
||
4 | 7--12 | [統計的機械翻訳] RBMTはあまりに大変だったので、翻訳済みの文書を大量に集めて、原文と訳文を対応づけた「パラレール?コーパス」を統計的に解析することによって、翻訳ソフトを自動的に作ることができるようになった。これを「統計的機械翻訳(SMT)」という。 しかし、SMTには、日本語と英語のように語順が大幅に変わる言語の間の翻訳がうまくいかない、という問題があった。それがいかに解決されたかを学ぶ。 |
||
5 | 13--15 | [ニューラル機械翻訳] 人間の脳の仕組みに学んだ深層学習の技術は、画像認識などで大成功を収めたが、その技術が機械翻訳に持ち込まれると、SMTで難しかった日英翻訳などにおいて、SMTの性能をあっという間に超えてしまった。この技術について学ぶ。 |
No. |
到達目標 /Learning Goal |
知識?理解 /Knowledge & Undestanding |
技能?表現 /Skills & Expressions |
思考?判断 /Thoughts & Decisions |
伝達?コミュニケーション /Communication |
協働 /Cooperative Attitude |
||
---|---|---|---|---|---|---|---|---|
1 | 統計的機械翻訳のおおまかな仕組みを説明できる | ○ | ○ | ○ | ||||
2 | ニューラル機械翻訳と統計的機械翻訳の得意?不得意について説明できる。 | ○ | ○ | ○ | ||||
3 | 言語横断検索のアプローチの違いについて説明できる。 | ○ | ○ | ○ |
No. |
到達目標 /Learning Goal |
定期試験 /Exam. |
予習してきたことの発表 | 授業中の質疑応答 | |||
---|---|---|---|---|---|---|---|
1 | 統計的機械翻訳のおおまかな仕組みを説明できる | ○ | ○ | ||||
2 | ニューラル機械翻訳と統計的機械翻訳の得意?不得意について説明できる。 | ○ | ○ | ||||
3 | 言語横断検索のアプローチの違いについて説明できる。 | ○ | ○ | ||||
評価割合(%) /Allocation of Marks |
50 | 50 |