網頁標題: [人物特寫] Google盲人程序員 拉蒙 (T. V. Raman)
 



                
註:本文中「拉蒙」 (T. V. Raman),在前一篇的報導中譯為「拉曼」。

拉蒙的網絡主頁上,第一句話是這麼寫的:「在互聯網上,沒有人知道你不是一條狗!」在接下來的頁面中,出現了很多他和導盲犬艾斯卡的照片。從康奈爾到硅谷,從IBM、Adobe一直到Google公司,十幾年間,導盲犬艾斯卡一直陪伴著這位來自印度的程序員。「可惜,他現在已經 13歲。老了,我沒法帶著他長途旅行了。」帶著墨鏡的拉蒙遺憾地說。前段時間,他參加了北京舉行的Google創新論壇,成為了全場的焦點,很多人也是第 一次想到這麼一個問題:互聯網讓世界發生了翻天覆地的變化,那麼,它給盲人帶來了什麼?               
                
  天賦 復原盲人魔方世界第一人 
                
  「普通人的互聯網,和盲人的互聯網,是同一個互聯網。」拉蒙似乎很高興被問到這個問題。「這也是為什麼互聯網對於盲人來說是多麼重要,這個工具賜予了人們平等。」

  「發電子郵件的時候,我們不會去關心對方用的什麼電腦,什麼鍵盤,屏幕是彩色的還是黑白的,只關心我們溝通了什麼內容。你編輯了一篇文章放在網上,你不會去關心閱讀你文章的人用的是PC還是移動設備。在萬維網面前,沒有限制,沒有邊界。所有人都是平等的。」

  坐在Google大樓的會議廳裡,一桌人將他團團圍住。拉蒙顯然是個重要人物,而他顯然也是所有人中最快樂的人物,從頭到尾,都在用笑話點綴著對話,永遠都有話說。

  他的手也似乎一直閒不下來。扳手指的動作讓他看起來有些緊張。坐在旁邊的美籍華人查爾斯給他遞去一張紙。拉蒙放鬆了下來,邊聊天邊開始折紙。查爾斯是和他最接近的同事,兩人共同設計著各種為盲人服務的軟件。在Google,人們往往把他們喊成「拉蒙和查爾斯」。

  拉蒙出生在印度普納一個有六個孩子的中產階級家庭。哥哥也做軟件工程的。「在印度,你不是軟件工程師就是醫生。」他口音濃重,笑聲爽朗,似乎自己進入這個行業是一件理所應當的事。

  從小,拉蒙就顯示出一些不同。如果在Youtube網站上輸入拉蒙的名字,可以看到他的一些視頻。拉蒙能在23秒內復原了盲文魔方,他是世界紀 錄的保持者。這是拉蒙年輕時最喜歡做的事情。再小一些的時候,比如15歲時,他剛因青光眼失去視力,幾乎每天都要玩一個解謎遊戲:通過日期,算出那天是星 期幾。「我從小就喜歡數學,喜歡解謎,可能是受哥哥影響。」他淡淡地笑道,「數學的興趣是天生的。老實說,不管怎樣我都會成為數學家。」

  多年後,有人向他提了這麼一個問題:看不見東西,那做數學題是什麼感覺?「我還真從來沒想過這個問題,一想才覺得真是有趣。」於是,他為此寫了 一篇論文《數學思考》,講述自己對數學的理解。他的核心想法是,數學遠比人們想像的要大得多,玩數學的習慣並不需要閱讀,而完全可以通過大腦心算來取得。

  讀屏 語音是常人語速的3倍

  在還沒有電腦的時代,學習對於盲人來說非常困難。儘管如此,拉蒙還是考入了印度最好的理工學校——印度理工學院,在這裡開始數學和計算機科學的 碩士研究,成為該校歷史上第一個盲人學生。他如何與那麼多優秀的青年學子一起求學?因為很多學生都被要求參與社會服務,所以他說服校長讓同學通過閱讀屏幕 來幫助他學習。有一個學期,多達13個同學志願幫助他朗讀屏幕,再由他用盲文進行記錄。

  1989年,拉蒙來到美國康奈爾大學做計算機科學博士研究。情況發生了變化。那時候,盲人用計算機剛剛出現。拉蒙也得到了自己第一台語音合成器和當時最先進的讀屏軟件。

  不過,哪怕是世界上領先的讀屏器,面對文字只有一行,每行只有40個字的老式屏幕也沒有更多招數。拉蒙只能一個字一個字慢慢地聽。

  好在過去幾十年裡,計算機技術發生了翻天覆地的變化。現在的顯示器可以漂亮地擺置60行字。而視覺障礙者使用電腦也已經不是什麼新鮮事了。今 天,他們可以很方便地借助讀屏器閱讀電腦屏幕,瀏覽互聯網。因為聽覺特別,他現在使用的讀屏器,語音速度是正常語速的三倍。這個語速常常會讓普通人「不知 所云」。

  如果只是進行文字瀏覽,盲人在電腦上幾乎沒有障礙。他們幾乎可以像其他人一樣輕鬆地瀏覽互聯網信息。上網查看新聞是拉蒙每天的愛好之一。不過, 與大部分人漫無目的地通過超鏈接在網上閒逛的習慣不同,拉蒙更多地採用搜索的方式,通過谷歌新聞組鏈接到有興趣的報紙文章,或者通過微博來找到有趣的東 西。用他自己的話說,就是讓朋友來做你的「編輯」,「過濾」出有趣的新聞給你讀。

  數學 公式也可以閱讀

  但在網絡上,還有很多信息,其結構是為視覺而設計的。一些我們每天都離不開的計算機操作,對於無法讀圖的人卻構成了巨大的障礙。如何將這些信息轉化為主要依賴於聽覺的盲人能夠接受的信號,這成為了拉蒙一直以來的主要工作。

  就拿簡單的電子郵件來說,「我們習慣於看到發信人欄,收信人欄,回復、轉發、正文等欄。我們讀的時候只會讀『這是拉蒙給查爾斯的一封信』,你眼 睛一掃很快就看出是誰給誰的信。」拉蒙說,「這所有的結構設計都是為了讓眼睛更方便。但是如果你用這個格式拿來讀的話就變成『發信人欄拉蒙,收信人欄查爾 斯,標題如何如何,正文如何如何』這就非常沒效率了。」

  還在康奈爾做博士時,拉蒙就設計出一些專為盲人辨別電子郵件各信息,甚至報紙報道標題的系統。

  閱讀文字解決了,但閱讀數學公式卻成為另一個難題。「再偉大的數學家,也需要閱讀其他數學家的東西。」他笑說。數學滿是符號和公式,用的是一種 名為LaTeX的排版系統。在上世紀90年代初的時候,讀屏器在這個系統中讀出來的數學公式簡直讓人抓狂。你能聽到一堆這樣的聲音:「E反斜槓反斜槓X插 入符號某某……」這樣的讀法是荒唐的,於是拉蒙決定重寫LaTeX,讓自己以及其他視障者都可以順利閱讀數學公式。這個研究成了他在康奈爾大學的博士畢業 論文,也讓他一直使用至今。

  說來有趣,當決定博士論文題目的時候,拉蒙最先想做的是製造出具有導航性能的機器人導盲犬。他花了9個月的時間投身其中。因為非常瞭解自己的導 盲犬,他一開始很有自信能夠做出來。但很快,一個不可逾越的困難卻出現了。難題並不在導航上,而是出現在如何製造一個能應付人行道、台階、雪地、冰地等各 種地面的機器人。20年之後,人類已經有了可以走在火星上的機器人,可是這樣的「萬能型機器人」還是沒有出現。

  圖像 手機「看」世界

  不過,拉蒙還是讓盲人也享受到了導航的便利。他拿出自己的手機,向記者展示智能的北京地圖,隨著他的手指的移動,語音快速地提示出走在哪條街, 走了多少路,前方是什麼路,還有多少距離到達目的地等信息。現在的拉蒙,只要一部手機給自己導航,一隻愛狗給自己掃除路障,哪怕身在北京這樣的陌生城市, 也不會迷路。

  現在,拉蒙的工作焦點放到了圖片識別上。這是「盲閱讀」最難的一部分。「所有的格式都是信息。信息越多,結構也越多;結構越多,你就越能從中組 織,處理這些信息。」拉蒙說,「閱讀圖片是最難的,給你一幅《蒙娜麗莎的微笑》,說『這是一個女人微笑的畫』。這並不能告訴你這是蒙娜麗莎,它的信息複雜 得多。」地圖其實就是圖片,不過它是有結構的圖片,各種道路、街道、大樓等信息組成了可以處理的數據。拉蒙和查爾斯開發的手機地圖軟件已經造福於很多人。 當然,它現在還沒到完美的程度,還有一些問題需要解決,比如,目的地大樓的入口在哪兒,進了大樓裡面怎麼辦,這都需要更多的數據讓工程師來設計。

  拉蒙說,現在另一個小組正在做一個通過手機「看」地貌的軟件。通過手機攝像機拍下路上遇到的一些事物比如路牌,行人等,手機可以對照片進行分析,然後告訴使用者「看」到了什麼東西。

  今天,互聯網進入了雲時代。他認為,這是視障者的福音。以前的視障人士,走出門外和鄰居打招呼都很難。但現在他們可以坐在家裡,和地球另一邊的 人直接溝通。「對於其他人來說,技術只是帶來了更快捷便利的生活,但對於殘疾人來說,他們本來做不了這些事情,但技術卻讓他們可以做這些事了,他們對技術 的掌握反而比普通人更快。」相比以前動輒上百美元的讀屏軟件,今天出現了很多開源軟件,人們都可以免費下載使用。對於殘疾人來說,雲時代的互聯網就像給他 們聽、讀、寫能力的延伸。而對於拉蒙來說,更重要的是,科學的發展是建立在別人研究基礎上,軟件技術也是一樣,只有通過開源,才能站在巨人的肩膀上,讓技 術的發展煥發活力。



文章來源網址:http://news.gochina.cn/read.php?48104
回 · 黑暗帝國 科技資訊 這一篇文章封面


本文張貼者:胖胖〔張貼時間:民國100年1月16日(星期天)22點54分〕 | 寫信給胖胖

部落格首頁


學習的故鄉首頁
本站公告:〔您越需要我們,我們就越有創意〕 本站說明書:〔發現故鄉還有改進的地方,請來信告訴原丁們〕
觀察應用學習點數 :〔咱的故鄉有您的參與,會使我們有更大的發揮空間,展現更豐富精彩的學習畫面〕 〔期待藉由無障礙網頁設計,能讓視障小朋友更愛看書、更愛寫作且更愛學習〕:盲用電腦「心得分享」
〔為了讓我們有乾淨的學習環境,請勿任意在本站散播商業廣告與不合法文件或聯結〕:本站宣示