谷歌团队“今年很忙”。“好久没看到Google线下活动在国内有这样的影响力了。”8月7日至8日,谷歌在北京举办2024年Google开发者大会,一位参会者感慨,“每一个展台都是人满为患,主要还是AI相关。”
在生成式AI成为大势的当下,谷歌这场国内的大会也获得了比以往更多的关注度。在展示区,从设备端生成式AI、多模态搜索、生成式AI革新电子商务的展示到各种应用案例的展示,包括Gemma应用智能大黄、Polyverse的Gemini1.5Pro应用展示以及高尔夫陪练,每一个展台前都围满了人。
相比去年的开发者大会,今年的展区已经基本上都是生成式的内容,谈及这一点,谷歌大中华区总裁陈俊廷表示,“这确实是谷歌的一个重点,所有人核心的一个任务。”
“AI的题目很大,AI有时候并不是一个单一的全新工具,而是将原有的工具进化,所以我相信做游戏的、做应用的、包括你知道的成功的企业,他们现在的能力都进化了,把AI的能力都加进去了。”陈俊廷表示。
在keynote演讲环节,从开发者的工具到安卓团队、云团队,所有演讲者提到的产品都是基于生成式AI的。
在开场演讲中,陈俊廷就提到了谷歌AI赋能的网易游戏营销,他提到,网易游戏在海外借助谷歌Cloud和VertexAI平台,提升了广告文案创作效率,工作时间从原本一周缩减到了几个小时,每月可生成700多条定制化的文案。在演讲中,陈俊廷还提到了小米新一代旗舰设备将利用谷歌Cloud和Gemini,为海外用户带来更智能的体验。
陈俊廷在演讲上手机厂商在这一届开发者大会的存在感很强,OPPO出现在了大会上,软件工程事业部总裁唐凯来到了现场分享生成式AI为手机行业在全球市场带来的创新及OPPO在AI手机领域的最新战略。
“作为一项革命性的技术,生成式AI对包括移动终端行业在内的各行各业都有着深远的影响。”唐凯提到,OPPO结合GoogleGemini模型,在全球市场上推出了一系列创新的AI功能,包括AI录音摘要和AI工具箱。
其中,AI录音摘要支持多说话人识别,能够自动识别并提取关键信息,智能地将冗长的会议内容整理成摘要,帮助用户快速捕捉并理解录音中的重点内容。AI工具箱则集成了AI文章摘要、AI文案生成和AI语音朗读三大功能,帮助用户高效阅读、产出创意文案。据介绍,这些工具都集成在ColorOS智能侧边栏中,用户可以随时轻松调用。
唐凯表示,这些AI功能已经在全新的ColorOS14上实现,并在海外发布的OPPOReno12系列机型上落地。他提到,通过与谷歌等伙伴的合作,OPPO正大力推动AI手机普及。
谷歌CoreML和谷歌Cloud工程副总裁BillJia在大会上表示,谷歌AI正在助力OEM厂商打造更智能的设备。谷歌的测试平台AndroidDeviceStreaming,联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于Beta阶段。
一些初创公司也在大会上展示了一些落地的案例。专注于出海和游戏应用的初创公司GuruNetwork也正在将谷歌的模型Gemma2用于播客应用Castbox,用户不用收听整集播客,就能快速掌握内容要点。Polyverse开发的AIMirror应用,通过Gemini的多模态功能优化了广告素材分析、文案和创意生成,显著降低了内容创作的时间和成本。
“这里的团队今年很忙(Theteamherehashadquiteabusyyear)。”谷歌DeveloperX和开发者关系副总裁兼总经理JeanineBanks今年是第二年来中国这一大会,她在大会分享了谷歌三种不同规模的大模型和技术更新,可以满足不同开发者的需求。
在谷歌的大模型系列中,GeminiNano是最高效的模型,可以直接在移动设备上运行,
此外,为了满足开发者对灵活性和掌控力的需求,根据具体应用场景对AI进行微调、增强和接地,谷歌推出了与Gemini系列模型一脉相承的Gemma系列开放模型,并于近期正式发布了比第一代模型更强大、更高效的新一代Gemma2模型,安全性也有了显著提高。
据介绍,Gemini已集成到众多开发工具中,包括AndroidStudio、ChromeDevTools、ProjectIDX、Colab、VSCode、IntelliJ和Firebase,可以帮助开发者编写、调试和测试代码,还可以生成文档、理解整个代码库等,成为开发助手。
在大会上,JeanineBanks提到,小米汽车SU7配套应用是基于开发框架Flutter所打造。在原有Flutter基础上,谷歌推出Flutter3.24和Dart3.5。新版最大看点是“FlutterGPU”新API的早期预览版。如通过内置FlutterSDK,开发者可使用Dart代码访问GPU,进而提高图像渲染能力。
Android开发技术推广部主管史婧羽在大会上分享了Mobile的最新动态,一些更新可以使得开发者利用Gemini构建下一代Android应用。比如,GeminiNano可以在移动设备端运行,提供低延迟响应和数据隐私保护,例如在聊天应用中实现智能回复等功能,同时确保数据不会离开设备端。即使在没有蜂窝网络的情况下,GeminiNano也能保证AI功能的可用性。
“这真是令人惊叹的一年,”在接受第一财经等媒体的采访时JeanineBanks表示,“去年我在上海的时候接触了很多中国的初创企业,当时我的感觉是这些企业在尝试各种各样的事情,去做一些AI方面的探索。一年过去了,我们不只是看到现在有更多的一些AI模型的建构,新的AI应用的开发,我还看到了大家正在开发出更复杂更精妙的一些AI系统。”
在这些复杂的AI系统中,不是只有一个智能Agent,而是有多个智能Agents,他们互相协同共同完成任务。“在一年之中就能够有这么多的变化,速度还是非常喜人的。”JeanineBanks说,一年之后,她看到了非常多的机会,服务市场的愿望也更强烈。
同时JeanineBanks观察到了第二个比较大的重心转移是,“以前大家非常多的重心是放在如何快速把更多的解决方案和应用交付给更多的用户,这一点当然还是重要的,但是现在大家也非常重视一点,就是当我们把AI的规模做大的同时,要达到合规,要履行负责任的AI的原则。”
陈俊廷认为,AI推动的进步不仅限于尖端生产力,在促进文化传承与造福社会上,同样有无限可能。广西民族大学运用Google全球AI开源技术,保护和传承少数民族非物质文化遗产;在四川的高原牧场,西南民族大学借助GoogleAI开源技术,改善了当地牧民的生活;谷歌公益与欣欣教育基金会合作,通过“编译梦想”项目为26所偏远地区小学的900多名学生提供AI入门教育。
谈及谷歌未来的计划,JeanineBanks认为,一方面是要坚持开源,帮助中国的开发人员更好出海,另一方面也会使用谷歌的技术专长,帮助出海的中国开发者、开发公司去面临复杂的海外业务,实现对海外不同市场的合规服务,进行产品的适配。