第11部分(第4/4 頁)
最新遊戲競技小說:
夭壽了,我在遊戲養了個修真女友、
網球鬼才:我的打法有億點點強、
星鐵:小判官身邊的傀儡師、
eva:從龍族歸來的碇真嗣、
輻射海求生,從小木筏到黑珍珠號、
HP就你叫伏地魔?黑魔王?這也不夠黑啊、
區區如懿,打就打了、
港片:拿王炸開局,專嚯嚯女神、
第五人格:各自安好、
火影:從百分百完美虛化開始!、
入住黃金庭院後,愛莉拉我直播、
女扮男裝後,我被校花瘋狂表白、
風流短跑之神、
時空中的深情、
魯魯修凌駕於諸天、
凹凸世界:雷震之女、
網遊之熟女陪我上青雲、
穿越戀歌:上官與夏侯、
【HP】布萊克家族、
莫名其妙的異世界冒險、
的工程師弗朗茨·奧奇(Franz Och)說:“在自然程式領域有一種著名的說法,‘更多的資料就是更好的資料’。”為什麼谷歌一直使用那些從Web網頁中搜集的2×1012詞彙量的文字?原因就在於:寫作質量無從擔保,但絕對海量的額外資料對翻譯演算法質量的改進卻是實實在在的。
獨步天下的谷歌演算法(13)
谷歌在機器翻譯方面的成就還不能被說成是獲得了足以養活自己的收益。谷歌在服務領域的拓展中所遇到的最複雜的問題就是,許多拓展專案對公司毫無貢獻,至少沒有直接貢獻。儘管如此,機器翻譯仍是一個恰當的專案。谷歌並沒有急於將它的機器翻譯能力投入商業###應用。它的機器翻譯團隊還只是谷歌實驗室的一部分,而且其主要精力都放在研究上。在實驗的基礎上,團隊在2007年為使用谷歌搜尋引擎的使用者提供了三種語言——###語、漢語、俄語——的英語翻譯服務。
隨著谷歌的翻譯工作不斷取得進展,它的翻譯結果也遠不止於經過了潤色和符合語言習慣。當《華爾街日報》的雙語(英語、###語)記者薩馬德·阿里(Sarmad Ali)於2007年12月在試用谷歌、Systran和另外兩個競爭者的阿-英線上翻譯服務時,他為這幾家公司的翻譯結果中的語法錯誤和語義錯誤列了一張表,按照錯誤的程度排列順序,從“值得斟酌”到“荒唐可笑”都有。
那一年的早些時候,谷歌的奧奇在一個公開的場合談及機器翻譯的結果時,談到了谷歌最好的一面:這個組織致力於不斷開拓資訊傳播的廣度,看不出它對自己的商業利益的關心。他說,如果聽眾中有人打算親手�
本章未完,點選下一頁繼續。