被逼急了的谷歌,開始展現(xiàn)真正的實(shí)力。
時(shí)隔三年,品玩/硅星人終于又回到了谷歌IO大會(huì)的現(xiàn)場(chǎng)。
在跟谷歌硅谷總部一街之隔的 Shoreline Amphitheatre露天劇場(chǎng)上,開發(fā)者和媒體參會(huì)者們?cè)缭绲鼐奂诖恕O噍^于過(guò)去這兩年人文氣息偏重、重磅產(chǎn)品較少的IO大會(huì),已經(jīng)拉響了紅色警報(bào)的谷歌今年顯然卯足了勁,無(wú)論還是 AI更新還是全新的硬件產(chǎn)品,今年谷歌IO都可以說(shuō)是近幾年來(lái)少有的一場(chǎng)科技盛會(huì)。
尤其突出的是,谷歌此次重磅打出了一系列AI組合拳,旗下幾乎所有產(chǎn)品都開始跟AI進(jìn)行全面集成、并進(jìn)行跨越式升級(jí)。在當(dāng)前AI競(jìng)賽中起跑慢了一步的谷歌似乎已經(jīng)不再藏著掖著,作為AI領(lǐng)域的長(zhǎng)期領(lǐng)導(dǎo)者,在本次IO上,谷歌充分向大眾展現(xiàn)了其巨大的AI能量和潛力。
在正式Keynote開始之前,現(xiàn)場(chǎng)首先預(yù)熱了幾首由谷歌全新音樂AI工具M(jìn)usicLM 和 Bard參與創(chuàng)作的迷幻電子音樂。
現(xiàn)場(chǎng)播放的AI制作的音樂《ducks with lips》,硅星人現(xiàn)場(chǎng)拍攝
在一片歡樂的氣氛中,谷歌CEO皮柴登場(chǎng),幾句簡(jiǎn)單的寒暄后他直擊主題,“眾所周知,人工智能今年非常忙碌,而作為一家 AI-first 公司,我們有很多話要談。所以,讓我們開始吧。”
Gmail、Maps等AI升級(jí),創(chuàng)造更智能的生活體驗(yàn)
活動(dòng)的一開始,谷歌先上了幾個(gè)“開胃前菜”。皮柴表示,谷歌的AI技術(shù)其實(shí)已經(jīng)被大量融入到了一些跟用戶日常生活息息相關(guān)的軟件之中,比如Gmail、Google 地圖和圖片編輯。
首先,大家期盼已久的Gmail自動(dòng)寫郵件功能終于來(lái)了。早在2017 年Gmail就推出了郵件的Smart Compose一鍵簡(jiǎn)短回復(fù)功能,而今天,谷歌在此基礎(chǔ)上推出了一個(gè)名為“Help Me Write”的全新功能,能夠幫助你快速撰寫完整的郵件和回復(fù)。
在IO上,谷歌展示了一個(gè)向航空公司申請(qǐng)退款用例,你只需告訴Gmail你想要退款的意圖,它就會(huì)根據(jù)你的航班詳情寫一份完整的郵件,同時(shí)也可以調(diào)整不同的語(yǔ)氣。
谷歌Map則引入了一個(gè)全新的3D沉浸式路線視圖功能。在 AI 和計(jì)算機(jī)視覺技術(shù)的幫助下,谷歌將數(shù)十億張航拍和街景圖像融合在一起創(chuàng)建了空間 3D 模型。也就是說(shuō),未來(lái)你用Google Maps進(jìn)行路線導(dǎo)航時(shí),你看到的不僅只是從A到B的2D路線,而是能夠以可視化的形式看到道路和周邊的建筑情況,甚至包括當(dāng)?shù)貙?shí)時(shí)天氣、交通等。
谷歌表示,這個(gè)功能將在今年很快上線,首先將在包括阿姆斯特丹、柏林、都柏林、佛羅倫薩、拉斯維加斯等15個(gè)城市推出。
此外,名為Magic Editor圖片編輯功能讓小白也能輕松改圖。跟蘋果此前的圖片功能類似,Magic Editor可以對(duì)照片中的不同事物進(jìn)行識(shí)別,并允許你用拖拉拽的方式進(jìn)行編輯。比如把人往左邊右邊拉一下,讓構(gòu)圖更加符合你的想象。
最強(qiáng)語(yǔ)言模型PaLM2亮相,Bard能力爆炸躍升
幾個(gè)小功能熱身之后,接下來(lái),谷歌此次真正的硬菜開始接連登場(chǎng)。首先,像此前大家猜測(cè)的一樣,谷歌推出了下一代超強(qiáng)語(yǔ)言模型PaLM 2。
PaLM 是 Google 在 2022 年 4 月宣布的大語(yǔ)言模型,使用了5400 億參數(shù)進(jìn)行訓(xùn)練,約是GPT-3的三倍。此次PaLM 2又在PaLM上進(jìn)一步進(jìn)行了提升和改進(jìn),具有多語(yǔ)言、推理和編碼功能。
PaLM 2 在多語(yǔ)言文本方面接受了更多的訓(xùn)練,涵蓋了 100 多種語(yǔ)言,對(duì)于理解、生成和翻譯包括成語(yǔ)、詩(shī)歌和謎語(yǔ)在內(nèi)的細(xì)微差別文本的能力非常顯著,還通過(guò)了“精通”級(jí)別的高級(jí)語(yǔ)言能力考試。
在推理方面,PaLM 2 的數(shù)據(jù)集包括科學(xué)論文和帶有數(shù)學(xué)表達(dá)式的網(wǎng)頁(yè),擁有超強(qiáng)的邏輯、常識(shí)推理和數(shù)學(xué)能力。
同時(shí),PaLM2在大量公共源代碼數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練,寫代碼能力更強(qiáng)了。除了 Python 和 JavaScript,還包括在 Prolog、Fortran 和 Verilog 中生成專用代碼等。
值得注意的是,PaLM 2已經(jīng)被開發(fā)出了不同的版本,可以面向不同的客戶、部署在不同企業(yè)環(huán)境中。
目前,PaLM 2有四種規(guī)格,從小到大依次為Gecko、Otter、Bison和Unicorn,其中,體積最小的Gecko可以在手機(jī)上運(yùn)行,每秒大約可處理20個(gè)Token,也就是約16或17個(gè)單詞。也就是說(shuō),開發(fā)者們不用花費(fèi)大量的時(shí)間和資源來(lái)創(chuàng)建和調(diào)整PaLM 2,而是能夠直接拿來(lái)就用進(jìn)行部署。
在谷歌內(nèi)部, PaLM 2也早已經(jīng)被用在了自家的25項(xiàng)功能和產(chǎn)品之中,其中也包括AI聊天機(jī)器人Bard、谷歌的全線辦公套件等。
在PaLM 2的加持下,此次Bard也開始真正的顯現(xiàn)出“ChatGPT殺手”的實(shí)力。
此前Bard是基于LaMDA 開發(fā),該模型擁有1370億種參數(shù),但現(xiàn)在Bard已經(jīng)全面轉(zhuǎn)用PaLM,在答案生成的數(shù)據(jù)組和更多元化的內(nèi)容方面能力飛升。同時(shí),谷歌將Bard跟旗下和外部產(chǎn)品的集成,讓Bard也跳出了聊天機(jī)器人的范疇,而是真正讓其成為了一款實(shí)用性工具。
比如現(xiàn)在Bard為你提供答案時(shí),除了文字之外,還能提供包括圖片、視頻、外部鏈接等多元化的信息。
比如你在問(wèn)了Bard問(wèn)題之后,你現(xiàn)在可以將這些問(wèn)題答案一鍵導(dǎo)出到Gmail、谷歌文檔、表格之中,Bard還可以動(dòng)幫你給圖片、文檔等做加標(biāo)注。未來(lái)也將支持更多谷歌應(yīng)用程序和Bard的集成體驗(yàn),包括Drive、地圖等。
對(duì)于軟件工程師們來(lái)說(shuō),Bard提供了改進(jìn)后的代碼引用功能,在提供來(lái)源的同時(shí)還能解釋代碼片段。此外,現(xiàn)在開發(fā)者們也可以把Bard生成的代碼進(jìn)行導(dǎo)出,不僅能發(fā)送到谷歌的Colab平臺(tái),還能和另一個(gè)基于瀏覽器的IDE Replit一起使用(目前支持首先Python)。
目前Bard能支持20多種編程語(yǔ)言,基本涵蓋了工程師們所有編程開發(fā)需要,并為開發(fā)者們提供了新的深色界面。開發(fā)者們只需輸入prompt就能得到完整的代碼片段。
此外,跟ChatGPT類似,Bard現(xiàn)在也可以跟其他外部工具進(jìn)行集成使用。在IO上谷歌也展示了一個(gè)Bard跟Adobe Firefly合作生成圖片的例子,比如你想給孩子辦一個(gè)生日派對(duì)需要做一個(gè)請(qǐng)柬照片,所要做的就是給Bard說(shuō)“制作一張?jiān)趦和蓪?duì)上獨(dú)角獸和蛋糕的圖像”,接著在Adobe的支持下它會(huì)在幾秒鐘內(nèi)生成四張圖像。這不就是Midjourney復(fù)雜操作方法的替代嗎?
除了Adobe之外,Bard目前還在推進(jìn)跟更多外部工具的集成使用,包括 Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等。
尤其重要的是,現(xiàn)在人人都可以用上Bard了。谷歌此次取消了等候隊(duì)列,Bard將面向180多個(gè)國(guó)家和地區(qū)的用戶全面開放。此外在英語(yǔ)之外,還增添了日語(yǔ)和韓語(yǔ)兩種語(yǔ)言,未來(lái)將逐步支持40種語(yǔ)言的交互。
回?fù)粑④汣opilot,谷歌工作套件迎來(lái)“Duet AI”
今年 3 月,微軟宣布推出Copilot之后,在生產(chǎn)力工具領(lǐng)域掀起了一場(chǎng)革命。谷歌當(dāng)時(shí)馬不停蹄地也為其 Workspace 應(yīng)用程序套件宣布了一系列人工智能功能,爭(zhēng)取在跟微軟的競(jìng)爭(zhēng)中不掉隊(duì)。當(dāng)時(shí),這些人工智能功能還比較零散,并沒有一個(gè)類似于Copilot這樣系統(tǒng)性的工具。
但在今天的IO上,谷歌終于給出了它的對(duì)標(biāo)方案——Duet AI。
跟微軟Copolit類似,Duet AI將被全面集成至谷歌旗下的Work Space,包括谷歌文檔、表格、幻燈片、會(huì)議、GmailMeet的自動(dòng)會(huì)議摘要等等。同時(shí)還推出了一項(xiàng)名為Sidekick的新功能,能夠跨不同的谷歌應(yīng)用程序進(jìn)行閱讀、總結(jié)和回答文檔中的問(wèn)題。
比如在文檔之中,直接輸入文章主題就能完整的生成一篇文章。
在谷歌表格中,僅需輸入一句話“遛狗業(yè)務(wù)客戶和寵物統(tǒng)計(jì)”就能自動(dòng)生成完整的表格,包含狗、地址、電子郵件、日期、時(shí)間、持續(xù)時(shí)間和費(fèi)用等,還可以通過(guò)自然語(yǔ)言命令來(lái)對(duì)表格進(jìn)行編輯。
在演示文稿中根據(jù)你的在側(cè)邊欄輸入的要求自動(dòng)生成PPT和插圖,并且按時(shí)間要求幫演示者總結(jié)每一頁(yè)的演講稿的講話內(nèi)容等等。
雖然這些功能我們?cè)谖④洿饲稗k公套件中都多多少少看到過(guò),但對(duì)于谷歌來(lái)說(shuō),此次Duet AI的推出,讓我們看到了谷歌在面對(duì)Copilot等競(jìng)爭(zhēng)對(duì)手時(shí)的應(yīng)對(duì)能力。
而除了應(yīng)用于辦公套件中之外, Duet AI 也將被應(yīng)用于谷歌云業(yè)務(wù)之中。借助Duet AI,谷歌云推出了一系列開發(fā)者工具,包括可以提供實(shí)時(shí)代碼幫助,指出錯(cuò)誤的同時(shí)推薦生成的代碼塊,以及回答代碼和谷歌云相關(guān)的問(wèn)題等。該功能支持 Go、Java、Javascript、Python 和 SQL等多種語(yǔ)言。谷歌表示,目前在谷歌云上進(jìn)行 AI 的訓(xùn)練速度提高了 80%,成本降低了 50%。
但目前,谷歌辦公領(lǐng)域的Duet AI功能還沒有對(duì)公眾進(jìn)行開放,如果想試用這些新工具,需要先注冊(cè)“工作場(chǎng)景實(shí)驗(yàn)室(Workspace Labs)”并加入等候名單。
生成式AI上線谷歌搜索,數(shù)十億用戶即將開啟搜索新旅程
面對(duì)Bing的步步緊逼,作為谷歌的立身之本,搜索業(yè)務(wù)此次也迎來(lái)了重大的AI更新。
跟Bing類似,在用戶搜索問(wèn)題之后,搜索欄的下方會(huì)首先出現(xiàn)由AI提供的更直接的答案,以及與這個(gè)問(wèn)題相關(guān)的圖片、鏈接、視頻等。根據(jù)第一次提問(wèn)返回的信息,你還可以進(jìn)一步進(jìn)行交互查詢更多的信息,知道你得到最需要的答案。
而當(dāng)你打算通過(guò)谷歌搜索并購(gòu)買一款產(chǎn)品時(shí),AI不僅能夠?yàn)槟惴祷啬阈枰漠a(chǎn)品鏈接還能夠?yàn)槟阆胭?gòu)買的產(chǎn)品提供摘要,包括提醒你購(gòu)買時(shí)需要注意的事項(xiàng)、產(chǎn)品的特點(diǎn)、最新的評(píng)論等等。
這種新的基于搜索的AI 購(gòu)物體驗(yàn)建立在谷歌的 Shopping Graph之上的,該Shopping Graph 擁有超過(guò) 350 億個(gè)產(chǎn)品列表,是目前世界上最全面的、且動(dòng)態(tài)更新的產(chǎn)品、賣家、品牌、評(píng)論和庫(kù)存數(shù)據(jù)集。但谷歌同時(shí)也強(qiáng)調(diào),廣告與自然搜索結(jié)果將被區(qū)分開來(lái),不會(huì)影響用戶的使用體驗(yàn)。
雖然AI功能登陸谷歌搜索令人振奮,但在全球數(shù)十億用戶面前,谷歌的推進(jìn)步伐仍然相對(duì)謹(jǐn)慎。跟Duet AI的工作場(chǎng)景實(shí)驗(yàn)室(Workspace Labs)”類似,為了測(cè)試全新的搜索功能,谷歌也設(shè)立了一個(gè)新的“搜索實(shí)驗(yàn)室(Search Labs)”,用戶如果想要訪問(wèn)這新的搜索功能,必須選擇一個(gè)名為 Search Generative Experience(簡(jiǎn)稱 SGE)的功能。
此外,谷歌也強(qiáng)調(diào)并非所有搜索都會(huì)引發(fā) AI 答案,只有當(dāng) Google 的算法認(rèn)為它比標(biāo)準(zhǔn)結(jié)果更有用時(shí)AI 才會(huì)出現(xiàn),而有關(guān)健康、財(cái)務(wù)等敏感主題的信息則不會(huì)出現(xiàn)。
一些全新的硬件亮相,首款可折疊的Pixel手機(jī)問(wèn)世
除了一系列AI更新之外,一些谷歌硬件粉也非常關(guān)注谷歌今年的產(chǎn)品更新,此次谷歌也誠(chéng)意滿滿,拿出了首款折疊手機(jī)、新的平板電腦和更親民的Pixel手機(jī)
Google的首款折疊屏產(chǎn)品亮相,售價(jià)1799美元起
而今年的硬件產(chǎn)品中,關(guān)注度最高的當(dāng)屬Google的首款折疊屏產(chǎn)品 Pixel Fold。該手機(jī)的造型非常類似OPPO發(fā)布的Find N系列,也采用“翻開即橫屏”的操作理念,讓用戶在使用折疊屏內(nèi)屏?xí)r無(wú)需在旋轉(zhuǎn)90度才可以達(dá)到全屏顯示的效果。
該機(jī)器的內(nèi)屏使用了一塊7.6英寸120Hz OLED柔性顯示屏,屏幕比例為5:6,分辨率為2208*1840,官方宣稱峰值亮度可達(dá)到1450nit。而外屏則為5.8英寸 120Hz OLED外屏,屏幕比例為9:17.4,分辨率2092*1080,峰值亮度可達(dá)到1550nit。
性能方面,Google Pixel Fold搭載了與Pixel 7系列相同的自研Tensor G2 處理器+ Titan M2 協(xié)處理器,配合12GB LPDDR5 內(nèi)存 + 256/512GB UFS 3.1 存儲(chǔ)組成Google的“性能鐵三角”。Pixel Fold擁有4821毫安時(shí)電池,支持30W有線快充,但不出意外的話Pixel Fold應(yīng)該算是今年售價(jià)超1萬(wàn)元的旗艦產(chǎn)品中充電速度最慢的產(chǎn)品了。
在發(fā)布會(huì)之前,Google宣稱Pixel Fold會(huì)擁有“Pixel級(jí)別的影像系統(tǒng)”,與爆料不同的是,Google Pixel Fold的后置鏡頭模組選擇了48MP廣角(支持OIS)+10.8MP超廣角+10.8MP 5倍長(zhǎng)焦的三攝組合。
Pixel Fold,硅星人現(xiàn)場(chǎng)拍攝
該機(jī)擁有黑白兩個(gè)配色,12GB+256GB的版本售價(jià)1799美元(約12450元人民幣),12GB+512GB版本售價(jià)1919美元(約13280元人民幣),現(xiàn)在預(yù)定購(gòu)買可免費(fèi)獲贈(zèng)一支Google在去年發(fā)售的 Pixel Watch手表。
平板電腦終于回歸,但不跟iPad搶市場(chǎng)
除去Pixel Fold之外,Google還在這屆I/O上正式發(fā)布了另一款大屏產(chǎn)品:Google Pixel Tablet。這也是Google沉寂多年后重返平板電腦市場(chǎng)的第一款產(chǎn)品,它的定位與目前市面上的平板電腦不同,更像是一個(gè)家庭智能終端設(shè)備。
Pixel Tablet并不是一款剛公布的產(chǎn)品,它的首次亮相是在一年之前。Google認(rèn)為平板電腦更多的使用場(chǎng)景是在家中而非室外,它是智能家居中樞,也是用于流媒體播放及視頻通話的多媒體終端。為此,Google為Pixel Tablet配備了一個(gè)磁力吸附的充電底座,讓它可以長(zhǎng)時(shí)間處于有電的狀態(tài)。
Pixel Tablet依舊使用Google自研Tensor G2 處理器,搭配8GB運(yùn)行內(nèi)存,128GB/256GB存儲(chǔ),售價(jià)499美元起(約3450元人民幣),不含底座。
入門級(jí)Pixel 7a發(fā)布,新增紅藍(lán)CP雙色
廉價(jià)版的Google Pixel a系列一直都會(huì)在正代Pixel發(fā)布的次年推出,Google Pixel 7a也不例外。該手機(jī)的外觀與Google Pixel 7采用了相同的設(shè)計(jì)語(yǔ)言,新增了更加活潑的珊瑚色和海洋藍(lán)兩個(gè)配色,更加適合有活力的年輕用戶。
硅星人現(xiàn)場(chǎng)拍攝
相比去年發(fā)布的Pixel 6a,7a的升級(jí)主要體現(xiàn)在處理器與攝像頭方面。Pixel 7a使用了與Pixel 7系列相同的自研Tensor G2芯片,并且將鏡頭模組升級(jí)為64MP廣角+13MP超廣角的組合,成像質(zhì)量將會(huì)有非常明顯的進(jìn)步。
與Google Pixel 7系列不同的是,Pixel 7a僅有8GB+128GB存儲(chǔ)這一個(gè)容量可選,但卻分為支持Sub 6 5G與mmWave 5G(毫米波)兩個(gè)版本,其中Sub 6 5G版本的售價(jià)為499美元(約人民幣3450元人民幣),而mmWave 5G版本的售價(jià)稍貴,為549美元(約3800元人民幣)。
總體來(lái)看,今天谷歌IO是一場(chǎng)誠(chéng)意滿滿的大會(huì),在整個(gè)開幕演講中,谷歌多次提到“大膽而負(fù)責(zé)任(bold and responsible)”這個(gè)詞,試圖證明谷歌可以在對(duì)社會(huì)和業(yè)務(wù)負(fù)責(zé)任的同時(shí)仍然可以快速行動(dòng)。
在此前的訪談中,皮柴曾表示谷歌并不擔(dān)心推出語(yǔ)言模型的步伐較對(duì)手慢,把事情做對(duì)比搶快更加重要。而現(xiàn)在,谷歌似乎已經(jīng)做好了一切準(zhǔn)備。
文| Juny 編輯| VickyXiao