谷歌:更新 Gemini 1.5 系列模型,发布多模态大模型全家桶 继 2023 年 12 月谷歌推出其规模最大、功能最强的多模态大模型 Gemini 系列之后,今年 2 月,谷歌发布 Gemini 1.5,在版本中首个登场的多模态通用模型Gemini 1.5 Pro,将稳定处理上下文的上限扩大至 100 万 tokens;5 月,在谷歌 IO 开发者大会上,谷歌大模型迎来多项升级,基础大模型方面,Gemini 1.5 Pro 将上下文窗口长度从之前的 100 万 tokens 进一步扩展至 200 万 tokens,谷歌首席执行官Pichai 称这是目前市场处理上下文长度规模最大的基础大模型。多模态大模型方面,谷歌发布了视频生成模型 Veo 以及文生图模型 Imagen 3,Veo 模型对标 Sora,能够根据文字、图片和视频的提示生成长度超过 1 分钟、分辨率最高 1080p 的视频;Imagen 3 文生图模型是 Imagen 系列的升级版,从细节拟真度来看对标Midjourney v6。