首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI日报:太卷了!2款文心大模型全免费;通义千问模型费用下降97%;豆包大模型也拼性价比

2024-05-21 15:12 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免费

百度智能云宣布免费开放ERNIE Speed和ERNIE Lite两大主力模型,ERNIE Speed为高性能大语言模型,适合精调处理特定场景问题;ERNIE Lite为轻量级大语言模型,适合低算力AI加速卡推理使用。

【AiBase提要:】

🚀 ERNIE Speed是百度 2024 年最新发布的自研高性能大语言模型,通用能力优异。

💡 ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能。

💻 ERNIE Speed和ERNIE Lite全面免费,立即生效。

2、阿里云宣布GPT-4级主力模型Qwen-Long API输入费用暴跌97%

阿里云宣布将其GPT-4级主力模型Qwen-Long的API输入价格大幅降低,为用户带来极大的优惠和竞争力,使得购买文本处理能力变得更加经济实惠。

【AiBase提要:】

🚀 API输入价格降至每千tokens0.0005元,降幅达97%,用户只需花费1块钱即可购买200万tokens。

💡 模型支持长达1千万tokens的文本输入,价格约为GPT-4的1/400,成为全球最具竞争力之一。

🌍 通义大模型通过阿里云服务企业超过9万家,通过钉钉服务企业超过220万家,受到海内外中小企业和开发者的广泛使用。

3、字节跳动豆包大模型价格清单公布:25元起

本文介绍了字节跳动旗下火山引擎官网更新豆包大模型定价的信息。豆包大模型在性价比上具有优势,主力模型价格降低了99%,性能价值比突出。豆包大模型家族包括多种成员,满足不同用户需求。计费模式灵活,后付费和预付费两种方式满足企业需求。

【AiBase提要:】

🔍 豆包大模型价格更新,起价仅25元,性价比优势明显。

💡 豆包大模型家族多样化,包括Pro、Lite等多种模型,处理能力强大。

💰 计费模式灵活,后付费和预付费两种方式满足企业需求。

4、智谱开源新一代多模态大模型CogVLM2

智谱·AI最近推出了新一代多模态大模型CogVLM2,性能显著提升,支持8K文本长度和1344*1344分辨率的图像。CogVLM2在多个基准测试中表现优异,展现出强大的文档图像理解能力。技术架构优化,模型大小为19B,性能接近或超过GPT-4V水平。推理时实际激活参数量约120亿,推理效率显著提高。

image.png

【AiBase提要:】

🚀 CogVLM2在OCRbench基准上性能提升32%,在TextVQA基准上提升21.9%。

💡 CogVLM2采用深度融合策略,视觉模态与语言模态紧密结合,保持语言处理优势。

🔥 CogVLM2在多个多模态基准测试中取得优异成绩,包括TextVQA、DocVQA、ChartQA等。

详情链接:https://github.com/THUDM/CogVLM2

5、面壁智能推出最新一代端侧多模态模型 MiniCPM-Llama3-V2.5

面壁智能推出的最新一代端侧多模态模型 MiniCPM-Llama3-V2.5 具有超强的综合性能,能够在 OCR 方面取得 SOTA 成绩,支持多种语言,实现了端侧系统级多模态加速,展现出强大的多模态综合能力,为端侧 AI 模型的发展带来新的突破。

image.png

【AiBase提要:】

🚀 MiniCPM-Llama3-V2.5具有超强综合性能,超越Gemini Pro和GPT-4V。

🔍 在 OCR 方面取得 SOTA 成绩,精准识别难图、长图和长文本。

💡 首次实现端侧系统级多模态加速,使图像编码速度提升150倍。

详情链接:https://github.com/OpenBMB/MiniCPM-VMiniCPM

6、腾讯计划投资月之暗面 估值或将达30亿美元

腾讯计划投资月之暗面,可能将其估值提升至30亿美元。这一举动显示了腾讯在人工智能领域的战略布局和竞争意图。中国人工智能产业的快速发展使得投资、竞争日益激烈,腾讯与月之暗面的合作将在业界引起关注。

【AiBase提要:】

🚀 月之暗面在人工智能大语言模型领域处于领先地位,吸引了腾讯等巨头的关注。

💰 月之暗面创立仅一年多时间,已完成超过10亿美元的融资,估值达25亿美元。

📈 腾讯将加入人工智能领域的竞争,计划投资其他大模型创业公司,强化竞争实力。

7、线条预处理器 Anyline新增Web UI适配

这篇文章介绍了 Anyline 最新的更新,为 Web UI Controlnet 新增了适配,提升了用户操作体验。Chenlei Hu 计划进一步简化 Anyline 的使用方式,并考虑将其更深入地集成到 ComfyUI 中。用户可以根据需求选择合适的基础模型,以获得最佳效果。更新将 Anyline 的强大功能带到了 Web UI 上,为专业设计工作和日常图像处理带来便利。

image.png

【AiBase提要:】

🔍 高精度线条提取: Anyline 能准确提取图像中的对象边缘、细节和文本内容,输出清晰边缘和高保真度文本的线条图。

🌐 广泛的适用性: 用户可以输入任何类型的图像,Anyline 都能快速处理,提供高质量的线条图。

🔬 纹理字体识别优势: Anyline 在轮廓准确度、物体细节、材质纹理和字体识别方面有明显优势,同时提供更好的降噪效果。

详情链接:https://top.aibase.com/tool/anyline

8、Meta发布类GPT-4o多模态模型Chameleon

本文介绍了Meta最近发布的多模态模型Chameleon,该模型在多模态模型领域设立了新的标杆,具有早期融合、统一Transformer架构等创新特点。Chameleon在各种任务上展现出广泛的能力,包括视觉问答、图像标注、文本生成等。文章还提到Chameleon面临的技术挑战以及Meta团队引入的架构创新和训练技术。

image.png

【AiBase提要:】

🌟 Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。

🔑 Chameleon模型在技术上面临了重大挑战,Meta的研究团队引入了一系列架构创新和训练技术。

💡 Chameleon模型在基准评估中全面超越了Llama2,在常识推理、阅读理解、数学问题和世界知识领域都取得了显著的效果。

详情链接:https://arxiv.org/pdf/2405.09818Chameleon

9、微软发布AI工具 Recall,帮助你找到那些找不到的文件

微软推出了Recall AI,为C o p i l o t+ PC系列提供了“照片记忆”功能,让用户通过语音查询文件、网站或电子邮件,并通过AI进行索引和搜索。这项功能可以帮助用户更轻松地找到所需信息,而且数据保留在设备本地,不用担心信息传输到云服务器。

image.png

【AiBase提要:】

🔍 Recall AI为C o p i l o t+ PC系列提供“照片记忆”功能,允许用户通过语音查询文件、网站或电子邮件,并通过AI进行索引和搜索。

🔍 Recall AI记录用户的屏幕操作,使用自然语言描述文件记忆,快速找到文档最新版本,让用户更轻松获取信息。

🔍 Recall AI仅适用于具有特定硬件要求的设备,如ARM64处理器、Snapdragon X Elite和X Plus等。

10、从零复现Llama3代码库爆火 Karpathy大神称赞作者是个有品的人

这篇文章介绍了一个教你从头开始实现Llama3的代码库在网络上引起轰动的情况。知名AI专家Andrej Karpathy对该项目给予高度评价,称赞作者Nishant Aklecha的详细解释和展示。文章详细解释了Llama3模型的实现过程,包括注意力机制、位置编码等关键内容。

【AiBase提要:】

🔥 代码库爆火,吸引无数开发者关注,Karpathy点赞转发评论

👨‍💻 作者Nishant Aklecha详细解释Llama3模型实现过程,包括注意力机制和位置编码

🚀 纳哥从头实现Llama3,展示每行代码功能,Karpathy称赞详细展开易理解

详情链接:https://top.aibase.com/tool/llama3-from-scratch

11、AI 框架Ambient Diffusion:从图像中获取灵感,而非复制

德克萨斯大学奥斯汀分校的研究团队开发了名为Ambient Diffusion的框架,通过对无法辨认的图像进行训练,绕过AI模型复制他人作品的问题。这一框架不仅在艺术领域有用,还有潜力应用于科学和医学领域,如黑洞成像和MRI扫描。研究团队的创新为人工智能发展提供了新思路。

image.png

【AiBase提要:】

🔍 Ambient Diffusion框架通过训练扰乱后的图像数据,解决AI模型复制作品的问题。

💡 该框架潜力巨大,可应用于艺术、科学和医学领域,如黑洞成像和MRI扫描。

📝 初步实验表明,Ambient Diffusion框架仍能生成高质量样本,而不需要识别原始源图像内容。

详情链接:https://arxiv.org/abs/2305.19256

12、好莱坞女星斯嘉丽抨击OpenAI抄袭她的声音用于ChatGPT

斯嘉丽・约翰逊声称OpenAI在她拒绝为ChatGPT提供声音后,仍擅自模仿了她独特的音调。OpenAI展示了与斯嘉丽・约翰逊在《Her》中扮演的人工智能助手极为相似的合成语音,但突然禁用了这一新声音。评论家批评OpenAI的行为,赞扬斯嘉丽・约翰逊的立场。

【AiBase提要:】

⭐ 斯嘉丽・约翰逊声称OpenAI擅自模仿她的音调。

⭐ OpenAI展示了与斯嘉丽・约翰逊在《Her》中扮演的人工智能助手相似的合成语音。

⭐ 评论家批评OpenAI的行为,赞扬斯嘉丽・约翰逊的立场。

13、英特尔推出新一代 Lunar Lake 芯片

英特尔计划在今年第三季度推出 Lunar Lake 笔记本处理器,旨在为 C opilot Plus PC 带来全新的 AI 体验。该芯片将提供比其前身 Meteor Lake 更高的三倍 AI 性能,预计在今年底前将搭载40多万颗 Lunar Lake 芯片。这一举措是英特尔在 AI PC 市场中的重要一步,旨在应对竞争对手的挑战。

【AiBase提要:】

⭐ Lunar Lake 芯片将采用 CPU、集成的 Xe2GPU 和神经处理单元(NPU),提供比其前身 Meteor Lake 更高的三倍 AI 性能。

⭐ 英特尔计划在今年底前向全球80多款新笔记本型号中搭载40多万颗 Lunar Lake 芯片,以应对 AMD 的 Zen5和高通的 Oryon。

⭐ Lunar Lake 处理器的 NPU 将能够执行超过40万亿次操作每秒(TOPS),远高于 Meteor Lake 芯片的10TOPS。这将为 AI PC 带来更强大的性能和更丰富的应用体验。

举报

  • 相关推荐
  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • 因跛脚被辞退 得力集团发文致歉:将依规依纪问责涉事人员

    9月30日,得力集团因员工走路跛脚被辞退一事登上热搜。该员工通过三轮面试后,入职当天因腿部问题被通知"不适应岗位"离职。其本人称虽有腿疾但无需辅助工具,且有7年职业经验。事件曝光后,得力CEO致歉并成立专项小组调查,确认情况属实。集团发布声明承认管理不足,将追责相关人员、清除歧视性标准、强化反歧视培训,并派高管当面致歉。公司承诺以此为契机完善人力资源机制,坚持"以人为本"理念。

  • 年订单破10万、加价千元仍爆满!年轻人带“毛孩子”出游成风口

    深夜12点的莫干山,一家民宿依然灯火通明。在层高6米的Loft房间里,所有管家正举着手电筒,踮着脚尖在沙发、窗帘和吊顶等地方,细细搜寻一位“特殊住客”——一只巴掌大的蜜袋鼯。 这只被游客带出来玩的蜜袋鼯,在下午突然不见了踪影。由于蜜袋鼯身形较小,而且有滑翔、攀爬能力,一旦走失,较难找回。 “客人下午发动朋友一起找了半天,没找到,已经按

  • 通义千问官方App在哪下载 通义千问2.0有哪些升级

    通义千问已经发布了2.0版本,2.0版本在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升,以下我们来看下通义千问2.0版本升级的功能。通义千问2.0在各方面的能力都有了巨大的进步,相比于今年4月推出的1.0版本,通义千问2.0在复杂命令处理、文艺创作、通用数学、知识储存、幻觉防御等方面都有了显著的提高。截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

  • 通义千问先“问”钉钉

    2023年钉钉生态大会,能替代真人参会的“数字分身”亮相,一同出现的还有帮助教师批改作业的“AI小助教”及企业的AI招聘专员。这些“数智人”同事以钉钉为入口,进入现实工作场景。钉钉用AI脱胎换骨的做法也表明,有应用的生态更容易AI化。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 通义千问2.0在哪里下载 通义千问iOS安卓版下载地址

    阿里巴巴通义千问2.0已经正式发布,根据阿里云CTO周靖人介绍,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,那么千问2.0在哪里可以使用呢,我们来看下具体的入口。通义千问APP已经可以在AppStore或者主要安卓市场下载。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务�

  • 通义千问有没有app?通义千问api接口文档在哪里找

    在10月31日的2023云栖大会上,阿里云CTO周靖人宣布阿里云将全面升级云计算体系,打造一个面向AI时代最开放的云,涵盖从底层算力到AI平台再到模型服务的全栈技术创新。中国有一半的大模型企业运行在阿里云上,280万AI开发者活跃在阿里云的魔搭社区上。更多详情可以关注Aibase产品库了解获取最新的产品发布信息。

  • 通义千问APP下载官网入口 通义千问手机版下载地址

    在2023年的云栖大会上,阿里云CTO周靖人宣布,阿里云将升级其云计算体系,以适应智能时代的需要,从底层的算力到AI平台再到模型服务,阿里云将提供全栈技术创新。周靖人还宣布了阿里云通义千问2.0的发布,这是一款千亿级参数规模的大模型,以及阿里云百炼,一站式模型应用开发平台。以上就是通义千问app的介绍,更多详细介绍可以前往Aibase产品库了解,各位小伙伴们快去试试吧!

  • 通义千问2.0将带来重磅升级 通义千问app怎么注册下载安装

    通义千问2.0将带来重磅升级,正式超越GPT-3.5,正在加速追赶GPT-4,成为业界的佼佼者。此次升级的核心在于其在性能上的巨大飞跃,不仅在复杂指令理解、文学创作、通用数学、知识记忆等方面有显著提升在幻觉抵御等能力上表现出色。以上就是通义千问app的介绍,更多详细介绍可以前往Aibase产品库了解,各位小伙伴们快去试试吧!

今日大家都在搜的词: