Windows 7操作系統的正式發布引發了新一代操作系統的大戰,谷歌公司也隨之殺入了這場競爭之中。與之相對應的是,互聯網終端,無論是計算機、手機還是電視屏幕,都被拉進了一個“云計算”時代的宏大敘事當中。在“云計算”的時代里,往日的IT業巨人將會扮演什么樣的角色,租用軟件服務會如何改變我們的生活,人工智能將走向何方?本報記者在微軟亞洲研究院采訪了洪小文院長,請他向大家描述了自己眼中計算機、人工智能和互聯網的未來。
【人物名片】 洪小文
畢業于臺灣大學電機工程學專業,于卡內基—梅隆大學獲得計算機碩士及博士學位,美國電機電子工程師學會院士,是國際公認的語音識別技術專家。曾就職于蘋果公司。1995年加入微軟亞洲研究院,并于2004年擔任微軟亞洲研究院副院長。2007年前任微軟亞洲研究院院長。
1 搞研發需要高情商
新京報:在微軟研究院里工作的都是“科學怪人”嗎?
洪小文:整個微軟9萬多職工,研究院的人數只占了1%,就像在社會中,科學家的數量也是少部分一樣。
他們不是愛因斯坦,都是普通人。不過,科研很多時候是在做夢,研究院的確會找一些對未來有夢想,能夠實現夢想的人。
新京報:他們的智商都非常高吧?
洪小文:是不是只有最聰明的人才能做科研,我不敢講。但對現實希望能更精益求精,追求夢想,這一定需要最聰明的人嗎?我們的科研人員是需要一些情商的。要講團隊合作,至少要讓大家喜歡和你工作。今天的互聯網,大部分的軟件都是針對人的,所以情商起到了很重要的作用。
新京報:你怎么看現在很火的“云計算”概念,以及這個領域人人都想分一杯羹的激烈競爭?
洪小文:“云計算”是必然的趨勢。很像買房。現在呢,你可能租房就可以了,里面什么都有。“云計算”技術下,只要接到了網絡,就可以得到所有你想要的東西。
有幾點還是要注意的:首先,還是有很多人要買房的,資料放在別人那里,安全性怎么保證?一定還是有人會用傳統的方式。有人說全球都會變成云計算什么的,我覺得這么說不負責任;另外,“公共云”和“私人云”還是有區別的。所以“云”是分很多種的;第三,“云”還是要和“端”結合起來;最后,云計算里面有一些有用的服務,但只有把軟件放在數據庫中才能產生服務,有了軟件才有內容。
2 軟件更新會快于硬件
新京報:“摩爾定律”說硬件的更新速度為每18個月更新一次,但過去30年中,計算機理論并沒有很大的突破。因此,摩爾定律將很難延續到2020年以后。這是真的嗎?
洪小文:每一行都會有瓶頸。所以應該放更多的經費在基礎科學上。我覺得任何時代都需要好的突破,我個人是樂觀的。今天微軟在說“三塊屏幕,同一片云”,指的是“電腦屏幕、手機屏幕、電視屏幕”,“云”是“云計算”。這些東西,幾年前是做不出來的。今天的手機,不但可以上網,還可以觸摸。這在五年前還只是個夢想。所以說互聯網只是一個基本的網絡,互聯網上可以做很多新的東西。基礎技術的創新才能讓我們繼續做下去。
新京報:所以你覺得摩爾定律可以繼續延續下去嗎?
洪小文:摩爾定律說的是硬件更新的速度,現在還有網絡和軟件更新的速度。任何硬件都有物理的極限,而軟件則是無形的。前段時間在松鼠會舉辦的科學嘉年華上,我向大家展示了一些現在正在開發的圖像軟件。圖像中,一個小狗在樹前,你把小狗切除掉,軟件可以自動把后面的背景還原了,這種技術現在一些地圖軟件中已經開始運用。切除的技術也很不一樣,我們隨便在一個物體或人上畫幾筆,就可以把這個物體切除掉。聽上去就好像做夢一樣。我個人是很樂觀的。
3 語音識別已經很準確
新京報:微軟亞洲研究院的專長主要在圖像和語音處理這塊,現在你們主要在做哪些方面的工作?
洪小文:現在研究院一個很重要的研發方向叫做“自然人機界面”的綜合技術。以前是要讓電腦模擬人,現在的方向則是要電腦用自己的方式了解你。今后的人和電腦之間,可以通過各種方式交流,比如如果有攝像頭的話,揮手就可以交流。另外,“云計算”是很新的領域,這也是很大的一個發展。你所有的信息、資料都在互聯網上,可以通過GPRS隨時知道你在哪兒,可以隨時向你傳遞你要的東西。
新京報:你是做語音出身,這方面會有哪些突破?
洪小文:語音合成會有很大突破。你現在隨便講任何話,我可以讓電腦錄下來,回頭分析你的語速。可以通過模擬,制作出你所需要的新的講話。比如周杰倫的粉絲,就可以錄他的聲音,然后用軟件讓“周杰倫”講任何你想聽的話,唱任何歌。
新京報:中文這樣復雜的語言,什么時候會出現準確率較高的語音輸入法呢?
洪小文:現在的office的中文語音輸入文章,準確性可達到95%,已經很不錯了。
當然真正讓電腦了解你講的每一句話,區分說話時的背景和噪音,這還是需要很復雜的技術的。人講話時會用手勢,會有身體語言,人工智能中也是這樣。多通道識別其實是更有意思的項目。
4 機器就該起輔助作用
新京報:我們會從鼠標和鍵盤中解放出來嗎?
洪小文:鼠標和鍵盤還是不錯的,人有時候講話是模糊的,比如說“把這個文檔刪除”,不如直接把文檔拽到“回收站”里。但如果屏幕是投影在墻上的,你再用鼠標就很怪,那就可以用一些手勢,空中畫幾筆,電腦就知道我在寫什么了。所以“自然人機界面”是研究院很大的研究方向。
新京報:這個主要借鑒哪些技術?
洪小文:比如紅外或普通的攝像頭,可以用來進行視覺識別。再比如陀螺儀技術,現在很多手機有一種游戲,可以位移手機,讓里面的一個球滾來滾去。兩個手機要發名片,你一“甩”就“甩”過去了,就是靠陀螺儀技術。
新京報:十年后的人工智能會是怎樣的?
洪小文:肯定比現在好,但是我相信還是會和人有一定距離。現在的人工智能已經能和人下棋,吸塵器到了轉角會自己轉彎的程度。但自動駕駛技術,一旦遇到眼前一片霧茫茫什么都看不見時,還是需要人的經驗。搞人工智能,我們要考慮目的是什么。如果人工智能是為了“造人”,那我們人類幾千幾萬年前就已經會了。人工智能的目的,是要造出和人一模一樣的智慧呢?還是為了讓電腦更好用,幫助人實現做不到的事情?從應用的角度看,機器就是該作為人的輔助。人走不快,汽車讓人走得更快,這就是很實用的想法。
3 語音識別已經很準確
新京報:微軟亞洲研究院的專長主要在圖像和語音處理這塊,現在你們主要在做哪些方面的工作?
洪小文:現在研究院一個很重要的研發方向叫做“自然人機界面”的綜合技術。以前是要讓電腦模擬人,現在的方向則是要電腦用自己的方式了解你。今后的人和電腦之間,可以通過各種方式交流,比如如果有攝像頭的話,揮手就可以交流。另外,“云計算”是很新的領域,這也是很大的一個發展。你所有的信息、資料都在互聯網上,可以通過GPRS隨時知道你在哪兒,可以隨時向你傳遞你要的東西。
新京報:你是做語音出身,這方面會有哪些突破?
洪小文:語音合成會有很大突破。你現在隨便講任何話,我可以讓電腦錄下來,回頭分析你的語速。可以通過模擬,制作出你所需要的新的講話。比如周杰倫的粉絲,就可以錄他的聲音,然后用軟件讓“周杰倫”講任何你想聽的話,唱任何歌。
新京報:中文這樣復雜的語言,什么時候會出現準確率較高的語音輸入法呢?
洪小文:現在的office的中文語音輸入文章,準確性可達到95%,已經很不錯了。
當然真正讓電腦了解你講的每一句話,區分說話時的背景和噪音,這還是需要很復雜的技術的。人講話時會用手勢,會有身體語言,人工智能中也是這樣。多通道識別其實是更有意思的項目。
4 機器就該起輔助作用
新京報:我們會從鼠標和鍵盤中解放出來嗎?
洪小文:鼠標和鍵盤還是不錯的,人有時候講話是模糊的,比如說“把這個文檔刪除”,不如直接把文檔拽到“回收站”里。但如果屏幕是投影在墻上的,你再用鼠標就很怪,那就可以用一些手勢,空中畫幾筆,電腦就知道我在寫什么了。所以“自然人機界面”是研究院很大的研究方向。
新京報:這個主要借鑒哪些技術?
洪小文:比如紅外或普通的攝像頭,可以用來進行視覺識別。再比如陀螺儀技術,現在很多手機有一種游戲,可以位移手機,讓里面的一個球滾來滾去。兩個手機要發名片,你一“甩”就“甩”過去了,就是靠陀螺儀技術。
新京報:十年后的人工智能會是怎樣的?
洪小文:肯定比現在好,但是我相信還是會和人有一定距離。現在的人工智能已經能和人下棋,吸塵器到了轉角會自己轉彎的程度。但自動駕駛技術,一旦遇到眼前一片霧茫茫什么都看不見時,還是需要人的經驗。搞人工智能,我們要考慮目的是什么。如果人工智能是為了“造人”,那我們人類幾千幾萬年前就已經會了。人工智能的目的,是要造出和人一模一樣的智慧呢?還是為了讓電腦更好用,幫助人實現做不到的事情?從應用的角度看,機器就是該作為人的輔助。人走不快,汽車讓人走得更快,這就是很實用的想法。
Copyright ©1999-2025 chinanews.com. All Rights Reserved