顶级欧美丰满熟妇XXXXX视频,中文字幕亚洲精品乱码,久久黑国产,中文字幕一区二区三区日韩精品 ,色九月亚洲综合网

人工智能

微軟Project Tokyo讓視障群體感知身邊友人,重啟社交

ainet.cn   2020年04月07日

  編者按:當(dāng)你和三兩好友聚會,你們在交談中會很自然地面向正在說話的人,頻頻對視,或身體前傾表示正在聆聽。眼神和肢體語言是交流中非常重要的一部分,但對盲人和視障群體來說,這幾乎是不可完成的任務(wù)。而微軟研究院 Project Tokyo 項目正在通過 AI 技術(shù)構(gòu)建個性化智能代理,賦予視障群體更多能力,讓不可能成為可能。

  12歲的失明男孩 Theo 坐在廚房的一張桌子旁。他戴著微軟 HoloLens 左右轉(zhuǎn)動頭部,攝像機、深度傳感器和揚聲器環(huán)繞著他的沙棕色頭發(fā)。

  當(dāng)他面朝微軟劍橋研究院高級研究軟件開發(fā)工程師 Martin Grayson 時,Theo 聽到一聲提示音,“Martin”從他耳朵上方響起來。

  “Martin,”西奧笑了,“它用五秒讓我認出了你?!?Martin 站在一個齊膝高的黑箱旁,其中的計算硬件正支持著 Theo 使用的機器學(xué)習(xí)模型的運行。

  Theo 再次轉(zhuǎn)動頭部,又一個名字響起來,“Tim”。

  “Tim,你在那里!” Theo 高興地“看”向 Tim Regan,他是微軟劍橋研究院的高級研究軟件開發(fā)工程師,同時也是 Theo 的編程老師,每兩個月,Theo 都會去 Regan 家中學(xué)習(xí)編程課程。Regan 此前在研究項目 Code Jumper 中認識了這個失明的男孩,Code Jumper 是專門為視障兒童開發(fā)的物理編程語言,用一種可觸摸的方式,讓對計算機科學(xué)感興趣、但視力上有困難的孩子們體驗編程的樂趣。

  他們正在進行的項目 Project Tokyo 希望為人類定制智能個人代理,用 AI 技術(shù)來延伸人們能力的界限。對長期身處黑暗與未知的 Theo 來說,能夠?qū)崟r地“認出”周圍的人們,是一種非常新奇的體驗。“不僅僅是說話的人,那些沒有說話的人,我從來不知道他們是誰、在哪兒。AI 技術(shù)讓我能用這種特別的方式感知到他們的存在?!?/FONT>

  Project Tokyo 有著更長遠的研究愿景——構(gòu)建能夠擴展所有用戶能力的智能個人代理,不僅僅是能夠完成特定任務(wù)的端到端的系統(tǒng),而是構(gòu)建一個能自適應(yīng)每一個人的不同需求的 AI 服務(wù)系統(tǒng)。

  微軟劍橋研究院高級研究軟件開發(fā)工程師 Martin Grayson(左)和微軟研究院高級研究員 Cecily Morrison(右)正在進行測試

 

源自巴西殘奧會的靈感

  Project Tokyo 誕生于2016年,由微軟研究院首席研究員 Ed Cutrell 和微軟劍橋研究院高級研究員 Cecily Morrison 共同發(fā)起,他們此前都有與盲人和弱視群體一起設(shè)計技術(shù)的經(jīng)歷,因此決定從視障群體入手,看看智能個人代理能如何幫助他們增強和擴展能力?!耙曊先后w往往是新技術(shù)的早期采用者,是非常好的合作對象,” Cecily Morrison 說,“我們一起想象未來關(guān)于人工智能的新體驗?!?/FONT>

  在前期調(diào)研中,他們跟隨一群參加巴西殘奧會的運動員和觀眾,從英國出發(fā)前往里約熱內(nèi)盧,觀察他們在機場、運動場館、觀光游覽等種種活動中,如何與他人進行互動。Cutrell 注意到,“我們?nèi)祟悓θ绾闻c人互動有非常細致和詳盡的社會理解——了解周圍是誰,他們在做什么,與我的關(guān)系是什么,但對于盲人來說,這些我們認為理所當(dāng)然的線索都消失了?!?/FONT>

  研究團隊與盲人和弱視社區(qū)一起舉辦了一系列研討會,來探討有哪些潛在的技術(shù)能夠為他們改變這一點。參與者中,有一位50多歲的盲人音頻工程師 Peter Bosher 提到一個常見的場景,“當(dāng)兩三個以上的人共處一室,人們會開始用眼神交流和肢體語言來表示‘我在和這個人或者那個人說話’,這一點對盲人來說真的非常困難。”

  因此他提出,有沒有一種技術(shù)能夠為盲人提供他們周圍的人的信息?這一想法立刻引發(fā)了大家的共鳴。

  微軟研究院首席研究員 Ed Cutrell 與項目中經(jīng)過改裝的 HoloLens 設(shè)備

 

HoloLens 的進化

  明確了 Project Tokyo 想要創(chuàng)造什么樣的 AI 體驗,研究團隊以微軟混合現(xiàn)實眼鏡 HoloLens 為基礎(chǔ)構(gòu)建 AI 技術(shù)。

  HoloLens 能將全息圖投影到用戶可操縱的真實世界中,為構(gòu)建與環(huán)境實時交互的 AI 代理提供了非常好的基礎(chǔ)。HoloLens 的灰度相機陣列可提供接近180度的環(huán)境視角,它的高分辨率彩色相機能夠高精度地進行面部識別,而位于用戶耳朵上方的揚聲器能夠提供空間感極其真實的音頻,讓聲音從特定的方位響起。

  研究團隊中的機器學(xué)習(xí)專家開發(fā)了一系列計算機視覺算法來識別環(huán)境中不同人的位置信息。其中一個模型用于檢測環(huán)境中人的姿勢,計算他們相對于用戶的位置和距離,另一個則能夠分析高分辨率相機拍攝的照片流,來識別和匹配照片中的人物是誰。隨后這些信息將通過音頻提示告訴用戶。

  比如,如果設(shè)備在用戶左側(cè)一米遠處檢測到朋友 A,用戶左耳將聽到咔嗒聲,聽起來像是來自左側(cè)一米遠處。用戶想知道這個人是誰,一個嗡嗡的音效會將用戶的視線引向 A 所在的方位。當(dāng) HoloLens 的中央攝像頭對準(zhǔn)了 A 的臉部,用戶會聽到一個尖銳的咔噠聲提示用戶已經(jīng)面朝 A 了。如果系統(tǒng)識別出了 A,就會為用戶念出 A 的名字。

  作為音頻工程師,Peter Bosher 在項目早期參與了音頻體驗的部分,“我特別喜歡這個工具為失明的我們帶來的這種‘凝視’的感覺,它能讓我們有一些肢體語言上的溝通?!?/FONT>

  盲人音頻工程師 Peter Bosher(中)在微軟劍橋研究院查看系統(tǒng)的最新版本

 

與視障社區(qū)一起制作原型

  隨著研究團隊對技術(shù)的開發(fā),研究人員開始進一步與視障社區(qū)合作,邀請盲人或視力不佳的成年人來親身體驗和測試這項技術(shù),提供真實的反饋信息。

  有幾位用戶認為不停地轉(zhuǎn)動頭部讓人感到很尷尬,希望能在頭部固定的情況下輕松地獲取系統(tǒng)收集的信息。這些反饋又使研究團隊開發(fā)了更多功能,比如在用戶頭部固定時,系統(tǒng)能用具有空間感的聲音,對辨認出的所有人作一個概述。

  如果我們感受到他人的視線,我們會從眼神交流開始自然地和對方展開交談。研究團隊據(jù)此研發(fā)了另一個實驗性的功能,當(dāng)環(huán)境中的某個人看向用戶時,系統(tǒng)會在那個方向發(fā)出提示音,但這個提示音后不會出現(xiàn)對方的名字。

  “不給出名字會讓你將注意力轉(zhuǎn)向那個試圖引起你注意的人,將頭轉(zhuǎn)向他們,而當(dāng)你直視對方時,系統(tǒng)會告訴你他的名字?!?Grayson 向一位體驗者解釋這個細微的設(shè)計。

  “我完全同意這一點,視力健全的人就是這樣反應(yīng)的。他們從眼角捕捉到某個人,然后轉(zhuǎn)過頭去叫他們的名字。”這位體驗者說。

  經(jīng)過改進的 HoloLens,攝像頭上方還裝有一個 LED 燈帶,白色表示正在追蹤接近用戶的人,綠色代表已為用戶識別這個人。這個功能可讓與用戶交流的朋友知道他們已經(jīng)被“看見”了,使交流更加自然,也能讓他們自由地選擇進入和移出設(shè)備的視野。

幫助視障兒童學(xué)習(xí)社會互動

  隨著研究的深入,研究團隊發(fā)現(xiàn),這項技術(shù)還擁有幫助盲人或弱視兒童發(fā)展社會互動能力的潛力。

  此前的研究表明,約有三分之二的失明或弱視兒童表現(xiàn)出了與自閉癥兒童相似的社交行為,比如在談話中似乎沒有在與談話對象交流,常常將頭靠在桌子上露出一只耳朵。于是,研究團隊開始探索這一技術(shù)是否可以幫助他們學(xué)習(xí)發(fā)起和維持與他人的社會互動。

  Theo 參與到這項體驗中,來幫助研究團隊更好地讓系統(tǒng)適配兒童的行為特征。比如孩子們總是喜歡坐在一起,但常常坐不了幾分鐘就起身跑來跑去。Theo 回憶起最初測試的場景,“系統(tǒng)有時會同時報出兩個名字,這讓我很難聽清,所以我說這一點需要改動?!?/FONT>

  研究人員還仔細觀察了 Theo 自由使用系統(tǒng)的方式。比如在一次家庭用餐時,Theo 開始巧妙地反復(fù)左右轉(zhuǎn)動頭部,讓系統(tǒng)說出正在與他說話的人的名字。

  “Theo 在用這個技術(shù)保持對談話者的空間注意力,” Morrison 當(dāng)時感到很驚訝,“我們之前并沒有想到,這對他來說無疑是一種行之有效的保持注意力的方式。如果他能保持注意力,他就可以與談話者將話題進行下去。”

  在實際測試中,更多的用途證實了這項技術(shù)對幫助視障兒童學(xué)習(xí)社會互動的潛能。

  和其他失明兒童一樣,Theo 在社交場合中也會將頭擱在桌子上露出一只耳朵。研究人員和 Theo 玩了一系列游戲,來發(fā)掘他用身體和頭部交流時可能產(chǎn)生的力量。

  在游戲中,研究人員和 Theo 要解決一個小組問題。Theo 知道問題的答案,研究員們只知道問題的主題,而且只有在 Theo 看著他們時,他們才能交談。如果 Theo 移開視線,他們必須立刻停止討論?!澳且豢蹋琓heo 突然意識到自己能夠掌控一段談話。他開始理解‘看到’他人的力量,它不僅賦予了他交流的技能,更使他習(xí)得了一套全新的社會能力?!?/FONT>

  現(xiàn)在 Theo 很少把頭放在桌子上說話了。無論是否帶著特制的 HoloLens,Theo 都會將自己的身體和臉面向想要談話的人。這是否會為 Theo 帶來長期的變化還是一個未知數(shù),研究團隊也尚不能確定其他失明或弱視力兒童是否也會做出類似的反應(yīng)。因此研究團隊正在進入下一階段,研究這項技術(shù)對更多兒童、年齡范圍更廣泛的人群的影響。

  失明少年 Theo 正在廚房里參與用戶測試

 

Project Tokyo 的未來

  為了構(gòu)建適用于更多人的智能個人代理系統(tǒng),更廣泛的研究工作正在進行中,包括讓用戶更自由地根據(jù)偏好調(diào)整系統(tǒng)的機器學(xué)習(xí)技術(shù)。例如,微軟劍橋研究院機器學(xué)習(xí)研究員 Sebastian Tschiatschek 正在研究用戶如何告知系統(tǒng)他們希望聽到的信息的種類和數(shù)量。

  由于用戶的視力水平不同,對信息的需求也不一樣。個性化的需求讓 Tschiatschek 必須采取非常規(guī)的機器學(xué)習(xí)方法,“我們想以某種數(shù)學(xué)形式將問題形式化,但對這個問題來說并不容易。許多開發(fā)工作都是通過嘗試,真正與人互動,了解他們的好惡,從而增強算法來實現(xiàn)?!贝送猓脩粼谙到y(tǒng)提供已知信息時會感到失望,還有很多這樣的問題尚待研究團隊解決。

  最終,Project Tokyo 將構(gòu)建可擴展所有用戶能力的智能個人代理。研究團隊將與視障社區(qū)中的更多兒童繼續(xù)探索,包括 Morrison 先天失明的7歲兒子 Ronan。

  “我們在 Theo 身上看到的情況讓人倍受鼓舞,他正在以前所未有的方式掌控自己的世界,” Morrison 充滿期待,“我認為我們將在 Ronan 和更多的人身上看到這一點?!?/FONT>

(轉(zhuǎn)載)

標(biāo)簽:微軟 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
億萬克
專題報道
2025全景工博會
2025全景工博會

第二十五屆中國國際工業(yè)博覽會(簡稱“中國工博會,CIIF”)將于今年9月23至27日在國家會展中心(上海)舉行。 [更多]

智能制造標(biāo)桿企業(yè)展播
智能制造標(biāo)桿企業(yè)展播

為了講述我國實體經(jīng)濟推進高質(zhì)量發(fā)展的鮮活實例,發(fā)揮好典型企業(yè)實施智能制造的示范作用,提振廣大制造業(yè)企業(yè)推進轉(zhuǎn)型升級的信心... [更多]

2025世界人工智能大會
2025世界人工智能大會

2025世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2025”)將于7月在上海世博中心和世博展覽館舉行... [更多]