-
OpenAI 将于今年秋天推出新的先进“Strawberry草莓”生成式人工智能产品
今年秋季,OpenAI将推出一款备受瞩目的新型生成式人工智能产品——“草莓”。据悉,这款名为“Strawberry草莓”的AI程序将带来一系列创新突破,它将大幅提升人工智能处理复杂数学题、执行战略任务以及深入探索各种主题的能力,而这一切无需依赖于特定的训练数据。 尽管关于“Strawberry草莓”开发的具体细节一直保持神秘,但项目的轮廓已经逐渐清晰。7月份,OpenAI的首席执行官Sam Alt…- 931
- 0
-
【AI论文与新生技术】SEED-Story:使用大型语言模型生成多模式长故事
随着图像生成和开放格式文本生成的显着进步,交错图像文本内容的创建已成为一个越来越有趣的领域。多模式故事生成的特点是以交错的方式生成叙事文本和生动的图像,已成为一项具有广泛应用的有价值且实用的任务。 然而,这项任务提出了重大挑战,因为它需要理解文本和图像之间复杂的相互作用,以及生成连贯的、上下文相关的文本和视觉效果的长序列的能力。在这项工作中,我们提出了 SEED-Story,这是一种利用多模态大语…- 2.3k
- 0
-
【AI论文与新生技术】VoCo-LLaMA:利用大型语言模型实现视觉压缩
视觉语言模型(VLM)在各种多模态任务中取得了显着的成功,但它们经常受到有限的上下文窗口和处理高分辨率图像输入和视频的高计算成本的瓶颈。视觉压缩可以通过减少视觉标记数量来缓解这个问题。以前的方法使用外部模块压缩视觉令牌并强制 LLMs 理解压缩的令牌,从而导致视觉信息丢失。 然而,视觉标记的LLMs理解范式在压缩学习过程中并未得到充分利用。我们提出了 VoCo-LLaMA,这是第一种使用 LLMs…- 1.2k
- 0
-
Anthropic绘制出了大型语言模型的思维图:大型语言模型到底是如何工作
今天,我们报告了在理解人工智能模型的内部运作方面取得的重大进展。我们已经确定了如何在 Claude Sonnet(我们部署的大型语言模型之一)中表示数百万个概念。这是对现代生产级大型语言模型的首次详细了解。这种可解释性的发现将来可以帮助我们提高人工智能模型的安全性。 我们大多将人工智能模型视为一个黑匣子:有东西进去就会有响应出来,但不清楚为什么模型会给出特定的响应而不是另一个。这使得人们很难相信这…- 704
- 0
-
过去的两年中,Hugging Face平台上的大型语言模型下载量突破10亿次
在过去的两年中,Hugging Face平台上的大型语言模型(LLMs)的下载量惊人地突破了10亿次大关。这一数字不仅彰显了人工智能领域对LLMs的热烈追捧,也证明了Hugging Face在推动AI技术普及和应用方面的重要贡献。 值得注意的是,Hugging Face平台上的模型每日下载量接近200万次,这一数据反映了全球范围内对AI技术的持续关注和浓厚兴趣。这些下载量中,GPT2模型以其卓越的…- 341
- 0
-
SEED-Bench-2-Plus:通过富含文本的视觉理解对多模态大型语言模型进行基准测试
理解富含文本的视觉内容对于多模态大语言模型(MLLM)的实际应用至关重要,因为丰富文本的场景在现实世界中无处不在,其特点是图像中嵌入了大量文本。 最近,具有令人印象深刻的多功能性的 MLLM 的出现提高了我们对 MLLM 的期望标准。然而,他们在文本丰富的场景中的熟练程度尚未得到全面、客观的评估,因为当前的 MLLM 基准主要侧重于评估一般视觉理解能力。在这项工作中,我们引入了 SEED-Benc…- 207
- 0
-
SnapKV:大型语言模型LLM 在生成之前就知道您在寻找什么
大型语言模型(LLMs)在处理广泛的上下文方面取得了显着的进步,键值(KV)缓存在提高其性能方面发挥着至关重要的作用。然而,随着输入长度的增加,KV 缓存的增长对内存和时间效率提出了挑战。 为了解决这个问题,本文引入了 SnapKV,这是一种创新且无需微调的方法,可以有效地最小化 KV 缓存大小,同时仍然在实际应用程序中提供可比的性能。我们发现模型中的每个注意力头在生成过程中始终关注特定的即时注意…- 333
- 0
-
苹果iOS 18前瞻:设备端AI功能引领智能手机新风尚
苹果公司即将在2024年发布的iOS 18操作系统中,引入一系列令人瞩目的设备端AI功能。这意味着,用户的iPhone和iPad将不再依赖外部云服务器,而是依靠自身强大的计算能力,为用户提供更高效、更安全的智能体验。 iOS 18的这些全新AI功能将深度集成到用户日常使用的各种核心应用程序中,从而为用户带来前所未有的便捷与智能。例如,升级后的Siri语音助手将拥有更强大的自然语言处理能力,能够更好…- 844
- 0
-
FlowMind:使用 LLMs 自动生成工作流程
快速发展的机器人流程自动化 (RPA) 领域在自动化重复流程方面取得了重大进展,但在需要用户要求的自发或不可预测任务的场景中,其有效性会降低。 详细介绍:https://huggingface.co/papers/2404.13050 论文链接:https://arxiv.org/pdf/2404.13050.pdf AIGC专区: https://heehel.com/category/aigc…- 457
- 0
-
《Mistral入门指南》课程解析:探索AIGC新生力量Mixtral 8x7B大型语言模型的无限可能
Mixtral 8x7B,一款由Mistral AI倾力打造的大型语言模型(LLM),凭借其稀疏专家混合模型(SMoE)的设计以及开放权重的特性,在多个基准测试中展现出了卓越的性能,甚至能够匹敌或超越Llama 2 70B和GPT-3.5等业界巨头。这款模型拥有47B的参数量,但令人惊叹的是,其中仅有13B参数在实际运作中保持活跃,这种设计不仅确保了模型的庞大参数量,同时也保证了高效的计算能力。 …- 303
- 0
-
Groma格罗马:用于奠定多模态大型语言模型的本地化视觉标记化
Groma,一种多模态大语言模型(MLLM),具有扎实的细粒度视觉感知能力。除了整体图像理解之外,Groma 还擅长区域级任务,例如区域字幕和视觉基础。 项目页面:https://groma-mllm.github.io/ AIGC专区: https://heehel.com/category/aigc 更多消息: https://heehel.com/category/ai-news 此类功能建…- 367
- 0
-
【坏心眼猫特效】ELLA 精准提示词生图大型语言模型下载comfyUI工作流使用演示教程
工作流和模型备用下载链接:https://pan.quark.cn/s/5230ea1ad5f9 github文章链接:https://github.com/TencentQQGYLab/ELLA 本视频主要介绍了ELLA模型的使用方法以及其在图像生成方面的优势。UP主首先介绍了ELLA模型的基本情况,然后展示了如何在comfyUI工作流中使用该模型,并提供了一份汇总和整合的ELLA工作流,以便用…- 573
- 0
-
【歸藏-GUIZANG】一个演示视频带你深切理解大型语言模型的核心 Transformer 架构的运行工作原理
非常好的一个演示视频,通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。 包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。- 241
- 0
-
Poe聊天机器人平台吸引新用户可获得最高50美元的收入
Poe聊天机器人平台正加大对创作者的奖励力度,机器人创建者每吸引一个新订阅者,最高可获得50美元(约等于358.465人民币)的收入。在GPTs商店上传过自定义GPT的朋友可以将自己的机器人复刻到Poe上,看看能不能拿到一些零食钱。这不仅激励了创作者们更积极地开发优质内容,也将吸引更多用户加入Poe平台。 Poe官网链接:https://poe.com/ AI工具专区:https://heehel…- 254
- 0
-
AI搜索引擎Perplexity来了,谷歌等老牌搜索引擎或许会有新的威胁?
Perplexity AI 是一家 AI 搜索初创公司,它通过结合内容索引技术和大型语言模型的推理能力,提供更便捷和高效的搜索体验。另外,最近很火的小兔子Rabbit R1硬件AI设备中的搜索功能正是这家公司的杰作。在短短一年半的时间里,一个企业能够获得超过5亿美元的估值,这无疑证明了其在某些方面的卓越之处。最近,市场研究机构WriterBuddy使用知名的SEO工具SEMrush,对3000多种…- 850
- 0
-
双刃剑:生成式AI人工智能对生活工作影响的双面性
今天看到,一篇文章,大概就是说AI的好与坏。现在生成式人工智能正变革社会多个领域,其普及将对人们生活产生深远影响。在提高效率、生产力和经济效益的同时,该技术也引发了关于道德使用的担忧。 好的地方: 快捷的业务流程 随着生成式人工智能的加速发展,企业可以借助其自动化复杂任务、促进创新和减少手动工作量的能力,削减SG&A成本高达40%。例如,大查询机器学习等模型可以加速数据分析,让企业享受更好…- 478
- 0
-
小透明 Mozilla 走向人工智能领域:开启开源技术驱动的下一代互联网时代
Mozilla 是一家以 Firefox 浏览器闻名的企业,但近年来,随着浏览器的重要性逐渐下降,Mozilla 开始寻找新的发展方向。他们开始进行初创公司投资,并推出了一些与人工智能相关的项目。包括对 Mastodon 的客户 Mammoth 进行投资,并收购了 Fakespot(Fakespot是一个帮助用户识别虚假评论的网站和浏览器扩展程序)。最近,一份关于 Mozilla 的总裁兼执行董事…- 377
- 0
-
那些动不动就“追上或超越”GPT的模型,球球你们收了神通吧
在“第一个中文大模型”、“第一个垂类大模型”等名号被各大科技公司相继占领之后,这场竞赛逐渐转移到了分数上,竞争者们纷纷宣称自己在某些维度上排名第一,或是在某方面远超GPT-4。性能不行,分数再高也没用呀。 原文链接:https://36kr.com/p/2577792552838530 AIGC专区:https://heehel.com/category/aigc 更多消息:https://hee…- 416
- 0
-
国产大型语言模型——天工:双千亿级大语言模型的多功能AI助手
AIGC专区:https://heehel.com/category/aigc 天工官方网站:https://home.tiangong.cn/ 更多作品:https://heehel.com/category/ai-works 「天工」是国内首个对标 ChatGPT 的双千亿级大语言模型,也是一个对话式 AI 助手。它通过自然语言与用户进行问答交互,具备生成创作、知识问答、规划决策、语言理解、代…- 1.2k
- 0
-
通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama2
【雷峰网(公众号:雷峰网)消息】上周五,全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜,阿里云通义千问Qwen-72B表现抢眼,以73.6的综合得分在所有预训练模型中排名第一,超越Llama2登顶榜首。 站内首页:https://heehel.com/ 更多消息:https://heehel.com/category/ai-news Hugging Face的开源大模…- 570
- 0
-
Agility 正在使用大型语言模型与其人形机器人进行通信,可以和机器人对话了?
Agility Robotics官方网址链接:https://agilityrobotics.com/about AIGC专区:https://heehel.com/category/aigc 初创公司 Agility (全名Agility Robotics,一家专门研发机器人的公司,他们研发的双足机器人Cassie步伐稳健、精准,可适应各种路面)利用其双足机器人 Digit 和大型…- 467
- 0
-
一个搞笑的吐槽文字总结大型语言模型CLoT,可以言简意赅的吐槽一张图片
CLoT:训练LLM成为吐槽能手 项目及演示网址链接:https://zhongshsh.github.io/CLoT/ 论文网址链接:https://arxiv.org/abs/2312.02439 GitHub网址链接:https://github.com/sail-sg/CLoT 工具专区:https://heehel.com/category/ai-soft CLoT这个大型语言模型项目目…- 630
- 0
-
用户投诉OpenAI GPT-4:速度极慢、回答敷衍、中断会话等问题频发
近期,用户对OpenAI的GPT-4大型语言模型提出了一系列投诉。有用户反映,在使用ChatGPT或GPT-4 API时,经常遇到速度极慢、回答敷衍、拒绝回答以及中断会话等问题。 外媒The Independent等报道综合指出,用户经常遇到以下问题:当用户要求GPT-4输入一段代码时,模型可能只会提供一些信息,然后指示用户填写其余的部分。有时候,GPT-4甚至会直接告诉用户:“你们完全可以自己完…- 264
- 0
-
生物技术初创公司Cradle获得2400万美元A轮融资,引领蛋白质设计革新
生物技术和人工智能初创公司 Cradle 近日获得了2400万美元的 A 轮融资,Cradle 的 A 轮融资由 Index Ventures 领投,Kindred Capital 和一些个人投资者也参与其中。公司表示将利用这笔资金来扩大团队和销售规模。取得了其生成式蛋白质设计方法的成功。该公司于一年多前推出了这一技术,正值大型语言模型的热潮兴起。Cradle 的独到之处在于,他们认为人体蛋白质中…- 173
- 0
❯
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
联系客服
公众号
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!