共 32 篇文章

标签：Google

谷歌CAT3D革新3D内容创建：多视图扩散模型引领快速高效新纪元

谷歌的最新创新——CAT3D，已经彻底改变了3D内容创建的方式。这项革命性的技术通过使用多视图扩散模型，模拟了现实世界中的捕获过程，使用户能够在短短一分钟内创建出高度一致的3D场景。在3D重建技术的演进过程中，尽管已经实现了...

HeeHel2024-05-18+AI动态

Google I/O盛会省流全内容总结：AI模型家族革新与前沿技术应用的广阔前景

昨晚的Google I/O 发布会主要聚焦于AI模型和应用的更新与扩展，特别在生成模型领域取得了显著进步。以下是模型层面内容的简要总结： DeepMind官网链接：https://deepmind.google/ Google Veo官方：...

HeeHel2024-05-15+AI动态

谷歌与 Airtel 合作为印度企业提供云和 genAI 产品

印度第二大电信运营商Airtel与谷歌云建立长期合作伙伴关系，共同开发和提供云及生成式人工智能产品给印度企业。此次合作旨在利用Airtel广泛的客户群，包括2,000家大型企业和100万家新兴企业，为企业提供包括地理空间分析、位置智能、预测...

HeeHel2024-05-13+AI动态

2024 年 Google IO 开发者大会将再次聚焦人工智能

Google 开发者大会将于 5 月 14 日下午 1 点（美国东部时间）主题演讲拉开帷幕。谷歌正准备在下周举办一年一度的 Google I/O 开发者大会，自然而然地，一切都将围绕人工智能展开。该公司对此毫不掩饰。自去年的 I/O 大会...

HeeHel2024-05-13+AI动态

谷歌展示 Gemini 模型新颖医疗模型：Med-Gemini 在医学领域的功能

各种医疗应用的卓越表现给人工智能带来了巨大的挑战，需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。 Gemini 模型在多模式和长上下文推理方面具有强大的通用能力，为医学领域提供了令人兴奋的可能性。基于 Gemini 的这...

HeeHel2024-04-30+AI动态

Google 推出用 Gecko 重新审视文本到图像评估

虽然文本到图像（T2I）生成模型已经变得无处不在，但它们不一定生成与给定提示相符的图像。虽然之前的工作通过提出用于收集人类判断的指标、基准和模板来评估 T2I 一致性，但这些组件的质量并未得到系统测量。人工评分的提示集通常很小，并且不会评估...

HeeHel2024-04-27+AI动态

谷歌刚刚推出了 ScreenAI，一种专门用于理解 UI 和信息图表的视觉语言模型

应用布局注释器、图标分类器、图像字幕模型和 OCR 引擎为每个 UI 元素提供详细注释。这对人机交互影响巨大。可能将永远改变用户体验的未来。官方介绍：https://heehel.com/google-screenai AIGC专区： h...

HeeHel2024-04-22+AI动态

Google即将推出AI办公视频工具Google Vids，一键生成专业宣讲视频

Google即将为用户带来一款全新的AI视频工具——Google Vids，它将集成多种功能，为用户提供一键式、高效的视频创作体验。 Google Vids凭借其强大的AI技术，能够一键生成故事板，并智能协助用户编辑内容。它将自动选择适合的...

HeeHel2024-04-10+AI动态

【AIGCLINK】SIMA：Google DeepMind 发布第一个实现自然语言在仿真环境或游戏中生成指令

Google DeepMind开发的SIMA是一个通用型可指导的多环境智能体，能够在各种视频游戏环境中通过自然语言指令完成任务。谷歌与八家游戏工作室合作，在九款不同的视频游戏中对SIMA进行了训练和测试，包括《无人天空》、《拆迁（Teard...

HeeHel2024-03-14AIGC

Google发表论文揭秘新型模型窃取攻击：低成本攻破ChatGPT，信息提取精度极高

论文链接：https://arxiv.org/abs/2403.06634 PDF夸克网盘链接：https://pan.quark.cn/s/82dc9b3ae704 Google发表论文介绍了一种新型模型窃取攻击方法，成功攻破ChatGP...

HeeHel2024-03-13+AI动态

Google谷歌通过文本、图像从而生成音频和视频的多模态学习模型：VideoPoet

VideoPoet是一种多模态学习模型，本身是一个大型语言模型（LLM），能够理解和处理文本、图像、音频等多种信息，并将其融合到视频生成过程中。它不仅能够根据文字描述生成视频，还能给视频添加风格化效果、修复和扩展视频，甚至从视频中生成音频。...

HeeHel2024-02-22+AI动态

Google Gemini 1.5：引领跨模态AIGC信息分析理解与视频内容推理的新篇章，与 Open AI 决一高下！

Gemini 1.5具有100万token的上下文理解能力，是目前最强！具有跨模态理解和推理：能够对文本、代码、图像、音频和视频进行高度复杂的理解和推理。允许分析1小时视频、11小时音频、超过30,000行代码或超过700,000字的文本。...

HeeHel2024-02-16AIGC

Google谷歌基于过去的数据来预测未来事件的发生的时间序列预测模型TimesFM：有助于人们做出更明智的决策

Google的研发团队已经开发出一种名为TimesFM的时间序列预测模型。该模型基于过去的数据来预测未来事件的发生，这在商业、金融和科研等多个领域都具有重大意义。通过使用TimesFM，商家可以更准确地预测未来产品需求，金融分析师能够更准确...

HeeHel2024-02-06+AI动态

谷歌GeminiUltra模型将在2月7号上线，同时Google聊天机器人Bard将更名为Gemini

以下是更新前瞻：谷歌Gemini将开启付费计划：Gemini Advanced，这是一个类似ChatGPT Plus的付费模式，可以访问Gemini Ultra 1.0，而Gemini Pro可能将继续免费。 Gemini的用户界面经过优...

HeeHel2024-02-05AI快讯

Google谷歌 Bard 聊天机器人安装 Imagen 2 图像模型支持文生图功能：可免费生成“高质量且逼真”的图像

谷歌宣布，旗下聊天机器人 Bard 的能力又取得了重大突破，由 Imagen 2（Google 最先进的文本到图像模型）提供支持的新图像生成工具，除了原有的语言处理技能外，现在它还可以免费生成“高质量且逼真”的图像。 Bard实验体验链接：...

HeeHel2024-02-02+AI动态

谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型，远程操作和收集 77,000 个机器人事件

演示 AutoRT 向多个建筑物中的20多个机器人提出指令，并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。实验表明，AutoRT 收集的此类“野外”数据明显更加多样化，并且 AutoRT 使用 LLMs 允许遵循能够符合...

HeeHel2024-01-25+AI动态

谷歌Google 推出 LUMIERE 多风格滤镜视频生成的时空扩散AI模型

Lumiere——文本到视频的扩散模型，旨在合成描绘真实、多样化和连贯运动的视频——这是视频合成中的关键挑战。为此，研究人员引入了时空 U-Net 架构，该架构通过模型中的单次传递一次性生成视频的整个时间持续时间。 LUMIE...

HeeHel2024-01-24+AI动态

谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE

谷歌开发了一款名为 ASPIRE 的训练框架，旨在增强人工智能（AI）模型的选择性预测能力。这款框架为模型引入了 “可信度” 机制，即模型会输出一系列答案，并为每个答案赋予一个正确概率评分。通过这种方式，ASPIRE 训练框架可以提高大语言...

HeeHel2024-01-24+AI动态

谷歌Google取消了与一家帮助培训谷歌巴德聊天机器人的人工智能数据公司合同

Google Bard是一种新的聊天机器人工具，是谷歌在大型语言模型基础上推出的聊天机器人。谷歌取消了与澳大利亚数据公司 Appen 的合同，该公司参与了 Bard、Search 和其他产品中使用的大型语言模型 AI 工具的训练。尽管开发...

HeeHel2024-01-24AI快讯

谷歌新型搜索方式——“Circle to Search”划圈搜索，画个圈圈查找你想知道的文本、图片、物品等内容

谷歌的“Circle to Search”功能是一种新型的搜索方式，用户可以在手机屏幕上画一个圈，圈选出想要搜索的特定部分，然后直接进行Google Lens搜索。类似识图功能，这个功能将于1月31日在部分高端 Android 智能手机（P...

HeeHel2024-01-19+AI动态

1
2
下一页
共 2 页

标签：Google

谷歌CAT3D革新3D内容创建：多视图扩散模型引领快速高效新纪元

Google I/O盛会省流全内容总结：AI模型家族革新与前沿技术应用的广阔前景

谷歌与 Airtel 合作为印度企业提供云和 genAI 产品

2024 年 Google IO 开发者大会将再次聚焦人工智能

谷歌展示 Gemini 模型新颖医疗模型：Med-Gemini 在医学领域的功能

Google 推出用 Gecko 重新审视文本到图像评估

谷歌刚刚推出了 ScreenAI，一种专门用于理解 UI 和信息图表的视觉语言模型

Google即将推出AI办公视频工具Google Vids，一键生成专业宣讲视频

【AIGCLINK】SIMA：Google DeepMind 发布第一个实现自然语言在仿真环境或游戏中生成指令

Google发表论文揭秘新型模型窃取攻击：低成本攻破ChatGPT，信息提取精度极高

Google谷歌通过文本、图像从而生成音频和视频的多模态学习模型：VideoPoet

Google Gemini 1.5：引领跨模态AIGC信息分析理解与视频内容推理的新篇章，与 Open AI 决一高下！

Google谷歌基于过去的数据来预测未来事件的发生的时间序列预测模型TimesFM：有助于人们做出更明智的决策

谷歌GeminiUltra模型将在2月7号上线，同时Google聊天机器人Bard将更名为Gemini

Google谷歌 Bard 聊天机器人安装 Imagen 2 图像模型支持文生图功能：可免费生成“高质量且逼真”的图像

谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型，远程操作和收集 77,000 个机器人事件

谷歌Google 推出 LUMIERE 多风格滤镜视频生成的时空扩散AI模型

谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE

谷歌Google取消了与一家帮助培训谷歌巴德聊天机器人的人工智能数据公司合同

谷歌新型搜索方式——“Circle to Search”划圈搜索，画个圈圈查找你想知道的文本、图片、物品等内容

快讯

热门文章

喜好儿——再不认真就输了！

致力于发现ai人工智能应用的新世界，长期更新目前热门AI教程与动态！期待在这个工业变革时代中，希望你我都能发出一点光。

切换注册登录

切换登录注册

标签：Google

快讯

热门文章

喜好儿——再不认真就输了！

致力于发现ai人工智能应用的新世界， 长期更新目前热门AI教程与动态！期待在这个工业变革时代中，希望你我都能发出一点光。

切换注册登录

切换登录注册

致力于发现ai人工智能应用的新世界，长期更新目前热门AI教程与动态！期待在这个工业变革时代中，希望你我都能发出一点光。