Google DeepMind是什麼?

如何將深度學習嵌入您使用的產品中

DeepMind可以提到兩件事情:Google人工智能(AI)背後的技術以及負責開發人工智能的公司。 這家名為DeepMind的公司是Alphabet Inc.的子公司,該公司也是Google的母公司,DeepMind的人工智能技術已經進入了許多Google項目和設備

如果您使用Google HomeGoogle智能助理 ,那麼您的生活已經以一些令人驚訝的方式與Google DeepMind相交叉。

谷歌如何以及為什麼要收購DeepMind?

DeepMind成立於2011年,其目標是“解決智能問題,然後用它來解決所有問題。”創始人以對神經科學的洞察力為武器解決機器學習問題,目標是創建功能強大的通用算法,學習而不需要編程。

人工智能領域的幾個大型參與者以人工智能專家和研究人員的形式看到了DeepMind提供的大量人才,而Facebook在2012年開始收購該公司。

Facebook的交易分崩離析,但谷歌在2014年收購了DeepMind並以約5億美元收購了DeepMind。 在2015年發生Google企業重組期間,DeepMind隨後成為Alphabet Inc.的子公司。

谷歌收購DeepMind的主要原因是啟動他們自己的人工智能研究。 雖然DeepMind的主校園在收購後留在英國倫敦,但一個應用團隊被派往位於加利福尼亞州Mountain View的谷歌總部,致力於將DeepMind AI與Google產品集成。

Google正在用DeepMind做什麼?

將密鑰交給Google時,DeepMind解決智能的目標沒有改變。 繼續深入學習 ,這是一種機器學習,不是針對特定任務的。 這意味著DeepMind不會針對特定任務進行編程,與早期的AI不同。

例如,IBM的Deep Blue著名擊敗了國際象棋大師加里卡斯帕羅夫。 然而,深藍設計用於執行該特定功能,除此之外無用。 另一方面,DeepMind旨在從經驗中學習,這在理論上使其可用於許多不同的應用。

DeepMind的人工智能已經學會瞭如何玩像Breakout這樣的早期視頻遊戲,甚至比最好的人類玩家還要好,而由DeepMind提供動力的計算機Go計劃設法打敗了冠軍Go玩家5。

除了純粹的研究外,Google還將DeepMind AI集成到其旗艦搜索產品和家用和Android手機等消費產品中。

Google DeepMind如何影響您的日常生活?

DeepMind的深度學習工具已在所有Google產品和服務中實施,因此,如果您使用Google進行任何操作,您很可能會以某種方式與DeepMind進行交互。

一些DeepMind AI已經被使用的最突出的地方包括語音識別,圖像識別,欺詐檢測,檢測和識別垃圾郵件,手寫識別,翻譯,街景,甚至本地搜索。

Google的超精確語音識別

語音識別或計算機解釋口頭命令的能力已經存在了很長一段時間,但SiriCortanaAlexa和Google Assistant等公司已經將它越來越多地帶入我們的日常生活中。

就Google自己的語音識別技術而言,深度學習已經取得了巨大成效。 事實上,機器學習使Google的語音識別能夠達到令人驚嘆的英語語言準確度水平,並達到與人類聽眾一樣精確的程度。

如果您有任何Google設備,例如Android手機或Google Home,那麼它就擁有直接的真實世界的應用程序。 每次當您說“好的,Google”後面跟著一個問題時,DeepMind會展示自己的力量來幫助Google智能助理了解您的意見。

機器學習應用於語音識別具有專門針對Google Home的其他影響。 與亞馬遜的Alexa使用八個麥克風來更好地理解語音命令不同,Google Home的DeepMind語音識別功能只需要兩個。

Google Home和助理語音產生

傳統的語音合成使用了一種稱為連續的文本到語音(TTS)的東西。 當你使用這種語音合成方法的設備進行交互時,它會查詢一個充滿語音片段的數據庫並將它們組裝成單詞和句子。 這會導致出現奇怪的詞彙變化,並且通常很清楚聲音背後沒有人。

DeepMind用一個名為WaveNet的項目來處理語音產生。 這可以讓人工生成的聲音聽起來更自然,就像您在手機上與Google Home或Google智能助理對話時所聽到的聲音。

WaveNet也依賴真人語音的樣本,但它不會直接使用它們來合成任何東西。 相反,它會分析人類語音樣本以了解原始音頻波形的工作原理。 這使得它可以訓練說不同的語言,使用口音,甚至訓練聽起來像一個特定的人。

與其他TTS系統不同,WaveNet還生成非語音聲音,如呼吸和嘴唇嘶嘶聲,這可以使它看起來更加逼真。

如果您想要了解通過連接文本到語音生成的聲音與WaveNet生成的聲音之間的差異,DeepMind會提供一些您可以聽到的非常有趣的語音樣本。

深度學習和Google照片搜索

沒有人工智能,搜索圖像依賴於上下文線索,如標籤,網站上的文字以及文件名。 借助DeepMind的深度學習工具, Google照片搜索實際上可以了解到什麼內容,讓您可以搜索自己的圖片並獲得相關結果,而無需標記任何內容。

例如,你可能會搜索“狗”,它會拉起你的狗的照片,即使你從來沒有真正貼過它們。 這是因為它能夠了解什麼樣的狗,就像人類學習什麼樣的東西一樣。 而且,與Google的痴迷者Deep Dream不同,它能夠識別各種不同的圖像,精確度超過90%。

Google Lens和Visual Search中的DeepMind

谷歌鏡頭是DeepMind最令人震撼的影響之一。 這本質上是一個可視化的搜索引擎,可以讓你在現實世界中捕捉某些東西的圖片,並立即提取關於它的信息。 如果沒有DeepMind,它就無法工作。

雖然實施方式不同,但這與Google+圖片搜索中使用深度學習的方式類似。 當您拍攝照片時,Google Lens可以查看它並確定它是什麼。 基於此,它可以執行各種功能。

例如,如果您拍攝了一個著名地標的照片,它將為您提供關於該地標的信息,或者如果您拍攝了本地商店的照片,則可以提取有關該商店的信息。 如果圖片包含電話號碼或電子郵件地址,Google Lens也能夠識別該圖片,並且可以讓您選擇撥打該號碼或發送電子郵件。