當你想要找罕見的灰腹綠錦蛇照片、或是有一段無法理解的外國語句,通常都可以透過 Google 來獲得需要的答案。但僅僅只是輸入關鍵字、就能跳出匹配搜尋結果的技術,對機器而言並非簡單的事情。而 Google 能夠讓一切變得如此容易的關鍵,正是他們在「機器學習 Machine Learning」上的長期研究成果!
然而,什麼是「機器學習 Machine Learning」?Google 又是如何透過這個技術打造出各項產品?
Google 的多項產品都有應用機器學習技術(圖片來源/記者譚偉晟拍攝)
為了推廣最新的 TensorFlow 開源機器學習系統,Google 研究員 Greg Corrado 博士特別以主題演講的方式,對外解釋這項 Google 相當看重的技術。過去當電腦需要辨識、分析一項數據時,可以讓電腦依循特定規則,來獲得所需要的結果。然而當智慧型裝置快速普及,各類數據資料翻倍提升之後,這種舊思維的電腦辨識方式漸漸跟不上數據提升的速度。
對電腦而言,看照片的方式與人腦相當不同(圖片來源/記者譚偉晟拍攝)
對此,Google 必須讓機器擁有更佳的自主學習能力,也就是依賴機器學習系統,讓電腦可以自行辨識、分析出用戶需要的結果。這當中的關鍵有幾個,首先電腦觀看事物的方式與人類相當不同,儘管讓電腦看懂的影像中的元素,也不見得就有辦法讓電腦辨識出意義,對電腦來說,透過顏色、線條、色調等元素,拼湊成一個「貓」、「狗」的意義出來並不容易,因此必須先讓機器有能力可以學著自己看東西。
電腦可能無法直接將各種元素串接成一個概念(圖片來源/記者譚偉晟拍攝)
其次,在電腦的眼中,一張照片可能有「4 個人、1 個蛋糕、2 根蠟燭」,但人眼一看就知道這是張拍攝生日的照片,因此必須讓電腦有足夠的判斷方式,來串影像或文本中的資訊,進一步判斷出各項數據所代表的意思。這就必須透過機器學習系統,讓電腦可以將預測結果與真實結果比對,逐漸發展出有效的辨別方式。
透過不斷修正預測模型,來使機器的分析能力提升(圖片來源/記者譚偉晟拍攝)
包含 Gmail 的垃圾郵件篩選、Google Photo 的照片自動分類、Google Translate 的拍照翻譯功能,這些都是機器辨識並且自動判斷出的結果。受惠於這項技術,Google 可以讓用戶在這個資訊爆量的時代,依舊有辦法找尋到所需的內容,而不會海量資料中沒了方向。