2012年1月16日 星期一

谷歌盲人工程師講述軟件設計之路

http://news.sina.com.tw/article/20120116/5589145.html

北京新浪網 (2012-01-16 03:10)分享|

  拉蒙的網絡主頁上,第一句話是這么寫的:“在互聯網上,沒有人知道妳不是一條狗!”在接下來的頁面中,出現了很多他和導盲犬艾斯卡的照片。

  從康奈爾到硅谷,從IBM、Adobe一直到Google公司,十几年間,導盲犬艾斯卡一直陪伴著這位來自印度的程序員。“可惜,他現在已經13歲。老了,我沒法帶著他長途旅行了。”帶著墨鏡的拉蒙遺憾地說。前段時間,他參加了北京舉行的Google創新論壇,成為了全場的焦點,很多人也是第一次想到這么一個問題:互聯網讓世界發生了翻天覆地的變化,那么,它給盲人帶來了什么?

  天賦 復原盲人魔方世界第一人

  “普通人的互聯網,和盲人的互聯網,是同一個互聯網。”拉蒙似乎很高興被問到這個問題。“這也是為什么互聯網對於盲人來說是多么重要,這個工具賜予了人們平等。”

  “發電子郵件的時候,我們不會去關心對方用的什么電腦,什么鍵盤,屏幕是彩色的還是黑白的,衹關心我們溝通了什么內容。妳編輯了一篇文章放在網上,妳不會去關心閱讀妳文章的人用的是PC還是移動設備。在萬維網面前,沒有限制,沒有邊界。所有人都是平等的。”

  坐在Google大樓的會議廳里,一桌人將他團團圍住。拉蒙顯然是個重要人物,而他顯然也是所有人中最快樂的人物,從頭到尾,都在用笑話點綴著對話,永遠都有話說。

  他的手也似乎一直閒不下來。扳手指的動作讓他看起來有些緊張。坐在旁邊的美籍華人查爾斯給他遞去一張紙。拉蒙放鬆了下來,邊聊天邊開始折紙。查爾斯是和他最接近的同事,兩人共同設計著各種為盲人服務的軟件。在Google,人們往往把他們喊成“拉蒙和查爾斯”。

  拉蒙出生在印度普納一個有六個孩子的中產階級家庭。哥哥也做軟件工程的。“在印度,妳不是軟件工程師就是醫生。”他口音濃重,笑聲爽朗,似乎自己進入這個行業是一件理所應當的事。

  從小,拉蒙就顯示出一些不同。如果在Youtube網站上輸入拉蒙的名字,可以看到他的一些視頻。拉蒙能在23秒內復原了盲文魔方,他是世界紀錄的保持者。這是拉蒙年輕時最喜歡做的事情。再小一些的時候,比如15歲時,他剛因青光眼失去視力,几乎每天都要玩一個解謎遊戲:通過日期,算出那天是星期几。“我從小就喜歡數學,喜歡解謎,可能是受哥哥影響。”他淡淡地笑道,“數學的興趣是天生的。老實說,不管怎樣我都會成為數學家。”

  多年後,有人向他提了這么一個問題:看不見東西,那做數學題是什么感覺?“我還真從來沒想過這個問題,一想才覺得真是有趣。”於是,他為此寫了一篇論文《數學思考》,講述自己對數學的理解。他的核心想法是,數學遠比人們想像的要大得多,玩數學的習慣並不需要閱讀,而完全可以通過大腦心算來取得。

  讀屏 語音是常人語速的3倍

  在還沒有電腦的時代,學習對於盲人來說非常困難。儘管如此,拉蒙還是考入了印度最好的理工學校──印度理工學院,在這裡開始數學和計算機科學的碩士研究,成為該校歷史上第一個盲人學生。他如何與那么多優秀的青年學子一起求學?因為很多學生都被要求參與社會服務,所以他說服校長讓同學通過閱讀屏幕來幫助他學習。有一個學期,多達13個同學志願幫助他朗讀屏幕,再由他用盲文進行記錄。

  1989年,拉蒙來到美國康奈爾大學做計算機科學博士研究。情況發生了變化。那時候,盲人用計算機剛剛出現。拉蒙也得到了自己第一台語音合成器和當時最先進的讀屏軟件。

  不過,哪怕是世界上領先的讀屏器,面對文字衹有一行,每行衹有40個字的老式屏幕也沒有更多招數。拉蒙衹能一個字一個字慢慢地聽。

  好在過去几十年里,計算機技術發生了翻天覆地的變化。現在的顯示器可以漂亮地擺置60行字。而視覺障礙者使用電腦也已經不是什么新鮮事了。今天,他們可以很方便地借助讀屏器閱讀電腦屏幕,瀏覽互聯網。因為聽覺特別,他現在使用的讀屏器,語音速度是正常語速的三倍。這個語速常常會讓普通人“不知所云”。

  如果衹是進行文字瀏覽,盲人在電腦上几乎沒有障礙。他們几乎可以像其他人一樣輕鬆地瀏覽互聯網信息。上網查看新聞是拉蒙每天的愛好之一。不過,與大部分人漫無目的地通過超鏈接在網上閒逛的習慣不同,拉蒙更多地采用搜索的方式,通過谷歌新聞組鏈接到有興趣的報紙文章,或者通過微博來找到有趣的東西。用他自己的話說,就是讓朋友來做妳的“編輯”,“過濾”出有趣的新聞給妳讀。

  數學 公式也可以閱讀

  但在網絡上,還有很多信息,其結構是為視覺而設計的。一些我們每天都離不開的計算機操作,對於無法讀圖的人卻構成了巨大的障礙。如何將這些信息轉化為主要依賴于聽覺的盲人能夠接受的信號,這成為了拉蒙一直以來的主要工作。

  就拿簡單的電子郵件來說,“我們習慣于看到發信人欄,收信人欄,回復、轉發、正文等欄。我們讀的時候衹會讀‘這是拉蒙給查爾斯的一封信’,妳眼睛一掃很快就看出是誰給誰的信。”拉蒙說,“這所有的結構設計都是為了讓眼睛更方便。但是如果妳用這個格式拿來讀的話就變成‘發信人欄拉蒙,收信人欄查爾斯,標題如何如何,正文如何如何’這就非常沒效率了。”

  還在康奈爾做博士時,拉蒙就設計出一些專為盲人辨別電子郵件各信息,甚至報紙報導標題的系統。

  閱讀文字解決了,但閱讀數學公式卻成為另一個難題。“再偉大的數學家,也需要閱讀其他數學家的東西。”他笑說。數學滿是符號和公式,用的是一種名為LaTeX的排版系統。在上世紀90年代初的時候,讀屏器在這個系統中讀出來的數學公式簡直讓人抓狂。妳能聽到一堆這樣的聲音:“E反斜杠反斜杠X插入符號某某……”這樣的讀法是荒唐的,於是拉蒙決定重寫LaTeX,讓自己以及其他視障者都可以順利閱讀數學公式。這個研究成了他在康奈爾大學的博士畢業論文,也讓他一直使用至今。

  說來有趣,當決定博士論文題目的時候,拉蒙最先想做的是製造出具有導航性能的機器人導盲犬。他花了9個月的時間投身其中。因為非常了解自己的導盲犬,他一開始很有自信能夠做出來。但很快,一個不可逾越的困難卻出現了。難題並不在導航上,而是出現在如何製造一個能應付人行道、台階、雪地、冰地等各種地面的機器人。20年之後,人類已經有了可以走在火星上的機器人,可是這樣的“萬能型機器人”還是沒有出現。

  圖像 手機“看”世界

  不過,拉蒙還是讓盲人也享受到了導航的便利。他拿出自己的手機,向記者展示智能的北京地圖,隨著他的手指的移動,語音快速地提示出走在哪條街,走了多少路,前方是什么路,還有多少距離到達目的地等信息。現在的拉蒙,衹要一部手機給自己導航,一衹愛狗給自己掃除路障,哪怕身在北京這樣的陌生城市,也不會迷路。

  現在,拉蒙的工作焦點放到了圖片識別上。這是“盲閱讀”最難的一部分。“所有的格式都是信息。信息越多,結構也越多﹔結構越多,妳就越能從中組織,處理這些信息。”拉蒙說,“閱讀圖片是最難的,給妳一幅《蒙娜麗莎的微笑》,說‘這是一個女人微笑的畫’。這並不能告訴妳這是蒙娜麗莎,它的信息復雜得多。”地圖其實就是圖片,不過它是有結構的圖片,各種道路、街道、大樓等信息組成了可以處理的數據。拉蒙和查爾斯開發的手機地圖軟件已經造福于很多人。當然,它現在還沒到完美的程度,還有一些問題需要解決,比如,目的地大樓的入口在哪兒,進了大樓裡面怎么辦,這都需要更多的數據讓工程師來設計。

  拉蒙說,現在另一個小組正在做一個通過手機“看”地貌的軟件。通過手機攝像機拍下路上遇到的一些事物比如路牌,行人等,手機可以對照片進行分析,然後告訴使用者“看”到了什么東西。

  今天,互聯網進入了云時代。他認為,這是視障者的福音。以前的視障人士,走出門外和鄰居打招呼都很難。但現在他們可以坐在家裡,和地球另一邊的人直接溝通。“對於其他人來說,技術衹是帶來了更快捷便利的生活,但對於殘疾人來說,他們本來做不了這些事情,但技術卻讓他們可以做這些事了,他們對技術的掌握反而比普通人更快。”相比以前動輒上百美元的讀屏軟件,今天出現了很多開源軟件,人們都可以免費下載使用。對於殘疾人來說,云時代的互聯網就像給他們聽、讀、寫能力的延伸。而對於拉蒙來說,更重要的是,科學的發展是建立在別人研究基礎上,軟件技術也是一樣,衹有通過開源,才能站在巨人的肩膀上,讓技術的發展煥發活力。

  本版采寫/本報記者 金煜 攝影/本報記者 浦峰

沒有留言:

張貼留言