首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI日报:太卷了!2款文心大模型全免费;通义千问模型费用下降97%;豆包大模型也拼性价比

2024-05-21 15:12 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免费

百度智能云宣布免费开放ERNIE Speed和ERNIE Lite两大主力模型,ERNIE Speed为高性能大语言模型,适合精调处理特定场景问题;ERNIE Lite为轻量级大语言模型,适合低算力AI加速卡推理使用。

【AiBase提要:】

🚀 ERNIE Speed是百度 2024 年最新发布的自研高性能大语言模型,通用能力优异。

💡 ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能。

💻 ERNIE Speed和ERNIE Lite全面免费,立即生效。

2、阿里云宣布GPT-4级主力模型Qwen-Long API输入费用暴跌97%

阿里云宣布将其GPT-4级主力模型Qwen-Long的API输入价格大幅降低,为用户带来极大的优惠和竞争力,使得购买文本处理能力变得更加经济实惠。

【AiBase提要:】

🚀 API输入价格降至每千tokens0.0005元,降幅达97%,用户只需花费1块钱即可购买200万tokens。

💡 模型支持长达1千万tokens的文本输入,价格约为GPT-4的1/400,成为全球最具竞争力之一。

🌍 通义大模型通过阿里云服务企业超过9万家,通过钉钉服务企业超过220万家,受到海内外中小企业和开发者的广泛使用。

3、字节跳动豆包大模型价格清单公布:25元起

本文介绍了字节跳动旗下火山引擎官网更新豆包大模型定价的信息。豆包大模型在性价比上具有优势,主力模型价格降低了99%,性能价值比突出。豆包大模型家族包括多种成员,满足不同用户需求。计费模式灵活,后付费和预付费两种方式满足企业需求。

【AiBase提要:】

🔍 豆包大模型价格更新,起价仅25元,性价比优势明显。

💡 豆包大模型家族多样化,包括Pro、Lite等多种模型,处理能力强大。

💰 计费模式灵活,后付费和预付费两种方式满足企业需求。

4、智谱开源新一代多模态大模型CogVLM2

智谱·AI最近推出了新一代多模态大模型CogVLM2,性能显著提升,支持8K文本长度和1344*1344分辨率的图像。CogVLM2在多个基准测试中表现优异,展现出强大的文档图像理解能力。技术架构优化,模型大小为19B,性能接近或超过GPT-4V水平。推理时实际激活参数量约120亿,推理效率显著提高。

image.png

【AiBase提要:】

🚀 CogVLM2在OCRbench基准上性能提升32%,在TextVQA基准上提升21.9%。

💡 CogVLM2采用深度融合策略,视觉模态与语言模态紧密结合,保持语言处理优势。

🔥 CogVLM2在多个多模态基准测试中取得优异成绩,包括TextVQA、DocVQA、ChartQA等。

详情链接:https://github.com/THUDM/CogVLM2

5、面壁智能推出最新一代端侧多模态模型 MiniCPM-Llama3-V2.5

面壁智能推出的最新一代端侧多模态模型 MiniCPM-Llama3-V2.5 具有超强的综合性能,能够在 OCR 方面取得 SOTA 成绩,支持多种语言,实现了端侧系统级多模态加速,展现出强大的多模态综合能力,为端侧 AI 模型的发展带来新的突破。

image.png

【AiBase提要:】

🚀 MiniCPM-Llama3-V2.5具有超强综合性能,超越Gemini Pro和GPT-4V。

🔍 在 OCR 方面取得 SOTA 成绩,精准识别难图、长图和长文本。

💡 首次实现端侧系统级多模态加速,使图像编码速度提升150倍。

详情链接:https://github.com/OpenBMB/MiniCPM-VMiniCPM

6、腾讯计划投资月之暗面 估值或将达30亿美元

腾讯计划投资月之暗面,可能将其估值提升至30亿美元。这一举动显示了腾讯在人工智能领域的战略布局和竞争意图。中国人工智能产业的快速发展使得投资、竞争日益激烈,腾讯与月之暗面的合作将在业界引起关注。

【AiBase提要:】

🚀 月之暗面在人工智能大语言模型领域处于领先地位,吸引了腾讯等巨头的关注。

💰 月之暗面创立仅一年多时间,已完成超过10亿美元的融资,估值达25亿美元。

📈 腾讯将加入人工智能领域的竞争,计划投资其他大模型创业公司,强化竞争实力。

7、线条预处理器 Anyline新增Web UI适配

这篇文章介绍了 Anyline 最新的更新,为 Web UI Controlnet 新增了适配,提升了用户操作体验。Chenlei Hu 计划进一步简化 Anyline 的使用方式,并考虑将其更深入地集成到 ComfyUI 中。用户可以根据需求选择合适的基础模型,以获得最佳效果。更新将 Anyline 的强大功能带到了 Web UI 上,为专业设计工作和日常图像处理带来便利。

image.png

【AiBase提要:】

🔍 高精度线条提取: Anyline 能准确提取图像中的对象边缘、细节和文本内容,输出清晰边缘和高保真度文本的线条图。

🌐 广泛的适用性: 用户可以输入任何类型的图像,Anyline 都能快速处理,提供高质量的线条图。

🔬 纹理字体识别优势: Anyline 在轮廓准确度、物体细节、材质纹理和字体识别方面有明显优势,同时提供更好的降噪效果。

详情链接:https://top.aibase.com/tool/anyline

8、Meta发布类GPT-4o多模态模型Chameleon

本文介绍了Meta最近发布的多模态模型Chameleon,该模型在多模态模型领域设立了新的标杆,具有早期融合、统一Transformer架构等创新特点。Chameleon在各种任务上展现出广泛的能力,包括视觉问答、图像标注、文本生成等。文章还提到Chameleon面临的技术挑战以及Meta团队引入的架构创新和训练技术。

image.png

【AiBase提要:】

🌟 Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。

🔑 Chameleon模型在技术上面临了重大挑战,Meta的研究团队引入了一系列架构创新和训练技术。

💡 Chameleon模型在基准评估中全面超越了Llama2,在常识推理、阅读理解、数学问题和世界知识领域都取得了显著的效果。

详情链接:https://arxiv.org/pdf/2405.09818Chameleon

9、微软发布AI工具 Recall,帮助你找到那些找不到的文件

微软推出了Recall AI,为C o p i l o t+ PC系列提供了“照片记忆”功能,让用户通过语音查询文件、网站或电子邮件,并通过AI进行索引和搜索。这项功能可以帮助用户更轻松地找到所需信息,而且数据保留在设备本地,不用担心信息传输到云服务器。

image.png

【AiBase提要:】

🔍 Recall AI为C o p i l o t+ PC系列提供“照片记忆”功能,允许用户通过语音查询文件、网站或电子邮件,并通过AI进行索引和搜索。

🔍 Recall AI记录用户的屏幕操作,使用自然语言描述文件记忆,快速找到文档最新版本,让用户更轻松获取信息。

🔍 Recall AI仅适用于具有特定硬件要求的设备,如ARM64处理器、Snapdragon X Elite和X Plus等。

10、从零复现Llama3代码库爆火 Karpathy大神称赞作者是个有品的人

这篇文章介绍了一个教你从头开始实现Llama3的代码库在网络上引起轰动的情况。知名AI专家Andrej Karpathy对该项目给予高度评价,称赞作者Nishant Aklecha的详细解释和展示。文章详细解释了Llama3模型的实现过程,包括注意力机制、位置编码等关键内容。

【AiBase提要:】

🔥 代码库爆火,吸引无数开发者关注,Karpathy点赞转发评论

👨‍💻 作者Nishant Aklecha详细解释Llama3模型实现过程,包括注意力机制和位置编码

🚀 纳哥从头实现Llama3,展示每行代码功能,Karpathy称赞详细展开易理解

详情链接:https://top.aibase.com/tool/llama3-from-scratch

11、AI 框架Ambient Diffusion:从图像中获取灵感,而非复制

德克萨斯大学奥斯汀分校的研究团队开发了名为Ambient Diffusion的框架,通过对无法辨认的图像进行训练,绕过AI模型复制他人作品的问题。这一框架不仅在艺术领域有用,还有潜力应用于科学和医学领域,如黑洞成像和MRI扫描。研究团队的创新为人工智能发展提供了新思路。

image.png

【AiBase提要:】

🔍 Ambient Diffusion框架通过训练扰乱后的图像数据,解决AI模型复制作品的问题。

💡 该框架潜力巨大,可应用于艺术、科学和医学领域,如黑洞成像和MRI扫描。

📝 初步实验表明,Ambient Diffusion框架仍能生成高质量样本,而不需要识别原始源图像内容。

详情链接:https://arxiv.org/abs/2305.19256

12、好莱坞女星斯嘉丽抨击OpenAI抄袭她的声音用于ChatGPT

斯嘉丽・约翰逊声称OpenAI在她拒绝为ChatGPT提供声音后,仍擅自模仿了她独特的音调。OpenAI展示了与斯嘉丽・约翰逊在《Her》中扮演的人工智能助手极为相似的合成语音,但突然禁用了这一新声音。评论家批评OpenAI的行为,赞扬斯嘉丽・约翰逊的立场。

【AiBase提要:】

⭐ 斯嘉丽・约翰逊声称OpenAI擅自模仿她的音调。

⭐ OpenAI展示了与斯嘉丽・约翰逊在《Her》中扮演的人工智能助手相似的合成语音。

⭐ 评论家批评OpenAI的行为,赞扬斯嘉丽・约翰逊的立场。

13、英特尔推出新一代 Lunar Lake 芯片

英特尔计划在今年第三季度推出 Lunar Lake 笔记本处理器,旨在为 C opilot Plus PC 带来全新的 AI 体验。该芯片将提供比其前身 Meteor Lake 更高的三倍 AI 性能,预计在今年底前将搭载40多万颗 Lunar Lake 芯片。这一举措是英特尔在 AI PC 市场中的重要一步,旨在应对竞争对手的挑战。

【AiBase提要:】

⭐ Lunar Lake 芯片将采用 CPU、集成的 Xe2GPU 和神经处理单元(NPU),提供比其前身 Meteor Lake 更高的三倍 AI 性能。

⭐ 英特尔计划在今年底前向全球80多款新笔记本型号中搭载40多万颗 Lunar Lake 芯片,以应对 AMD 的 Zen5和高通的 Oryon。

⭐ Lunar Lake 处理器的 NPU 将能够执行超过40万亿次操作每秒(TOPS),远高于 Meteor Lake 芯片的10TOPS。这将为 AI PC 带来更强大的性能和更丰富的应用体验。

举报

  • 相关推荐
  • 大家在看
  • ComfyUI-Hallo:一个定制的ComfyUI节点,用于Hallo模型。

    ComfyUI-Hallo是一个为Hallo模型定制的ComfyUI插件,它允许用户在命令行中使用ffmpeg,并从Hugging Face下载模型权重,或者手动下载并放置在指定目录。它为开发者提供了一个易于使用的界面来集成Hallo模型,从而增强了开发效率和用户体验。

  • AI Word Summarizer:AI驱动的文档摘要工具,快速生成文档摘要。

    AI Word Summarizer是一款利用高级人工智能技术快速生成Microsoft Word文档摘要的在线工具。它通过用户友好的在线界面,帮助用户节省时间,提高工作效率。该工具支持将DOCX/DOC格式的文档转换为文本,并在几秒钟内生成摘要。它还提供了与文档对话的功能,允许用户提出问题并获得即时的洞察和澄清。

  • AI Math GPT Solver Powered by GPT-4o:AI驱动的数学问题解决器

    AI Math GPT Solver是一个由GPT-4o提供动力的在线数学问题解决平台,它覆盖了代数、微积分和几何等数学领域,集成了微软数学求解器等领先技术,提供快速、准确的解决方案。该平台通过网页和移动应用程序提供免费、用户友好的服务,允许用户随时随地解决问题。

  • GPT4o.so:革命性AI技术,多模态智能互动

    GPT-4o是OpenAI的最新创新,代表了人工智能技术的前沿。它通过真正的多模态方法扩展了GPT-4的功能,包括文本、视觉和音频。GPT-4o以其快速、成本效益和普遍可访问性,革命性地改变了我们与AI技术的互动。它在文本理解、图像分析和语音识别方面表现出色,提供流畅直观的AI互动,适合从学术研究到特定行业需求的多种应用。

  • 知闻AI:基于AI技术的新闻聚合平台

    知闻AI是一个利用人工智能技术为用户提供高质量新闻内容的新闻聚合平台。它通过分析大量新闻源,筛选出准确、及时的新闻,帮助用户获取有价值的信息。平台特点包括智能评估、多元视角、AI摘要等,以提高用户的阅读效率和信息获取质量。

  • MidJourney Sref Codes Library:探索和标记您喜爱的MidJourney Sref代码。

    MidJourney Sref Codes Library是一个在线资源网站,提供MidJourney平台上的高质量Sref代码集合。这些代码用于生成具有独特和一致风格的图像,为艺术家和创作者提供了实现特定视觉效果的强大工具。

  • Humanize.im:将AI文本转化为自然人类语言。

    Humanize.im是一个先进的AI文本人性化工具,旨在将AI生成的文本转化为更自然、更具吸引力的人类语言。它利用高级算法进行上下文分析和情感分析,确保文本在上下文和情感上适当且一致,同时增强可读性和相关性。该工具支持多语言,具有跨设备功能,并且注重数据安全。Humanize.im通过持续的反馈循环不断改进,以确保生成的文本与人工撰写的文本无异,有效绕过AI检测系统如GPTZero。

  • 免费在线转换文字为语音:将文本转换为逼真语音的在线工具

    该产品是一个先进的在线文字转语音工具,使用人工智能技术将文本转换为自然逼真的语音。它支持多种语言和语音风格,适用于广告、视频旁白、有声书制作等场景,增强了内容的可访问性和吸引力。产品背景信息显示,它为数字营销人员、内容创作者、有声书作者和教育工作者提供了极大的便利。

  • Kling AI:文本到视频的革命性生成模型

    Kling AI是由快手科技开发的文本到视频生成模型,能够根据文本提示生成高度逼真的视频。它具有高效的视频生成能力,长达2分钟的30帧每秒视频,以及3D时空联合注意机制和物理世界模拟等先进技术,使其在AI视频生成领域具有显著的竞争优势。

  • LocalhostAI:与Chrome和Gemini Nano无缝协作的AI助手。

    LocalhostAI是一款旨在提高用户生产力的AI助手应用。它与Chrome浏览器和Gemini Nano设备紧密集成,使用户能够利用先进的AI模型来提升工作效率。该产品的主要优势在于其内置的Chrome AI模型、支持离线使用、注重隐私保护、运行速度快且完全免费。

  • TravelTrail:智能旅行规划助手,轻松管理你的旅程。

    TravelTrail是一款旅行规划应用,通过人工智能技术帮助用户创建和组织旅行计划。它允许用户保存梦想目的地的列表,探索每个城市的详细信息,并根据个人喜好定制旅行体验。应用支持多语言,包括中文、英文等,为用户提供了便捷的旅行规划工具,无需担心语言障碍。

  • i18nlocale:AI驱动的多语言翻译工具,本地化且易于使用。

    Local + Effortless i18n Translation是一个AI驱动的翻译工具,支持200多种语言的本地化翻译,不接触服务器,与JSON格式无缝集成。它提供了一次性购买的可负担价格,并且提供免费试用,以帮助企业轻松实现多语言内容的本地化。

  • AI Content Mate:AI驱动的Figma插件,实现文本的智能替换。

    AI Content Mate是一个Figma插件,它通过AI技术帮助用户在设计中自动选择和替换文本。它能够理解文本的上下文,提供智能且相关的替代选项,同时允许用户添加自定义的注释和指南以确保生成的文本符合特定需求。这个插件提供了免费访问,通过Grok-cloud API密钥,用户可以享受AI驱动的文本转换功能,无需任何成本。

  • ReelGen:AI驱动的内容生成平台,轻松创造高质量播客和博客。

    ReelGen是一个利用先进人工智能技术的内容生成平台,旨在帮助用户轻松创建高质量的播客和博客文章。用户无需具备技术技能,通过ReelGen的用户友好界面,几分钟内即可开始创作。平台提供定制化服务,允许用户根据品牌的声音和风格调整内容,从音频质量到文本转语音的细节,确保内容与用户愿景相匹配。ReelGen专注于内容生产,让用户专注于创作,而将生产过程中的重活交给平台,从而在不牺牲质量的前提下,用更少的时间生产更多的内容。

  • AI Reveals:使用AI技术创造惊人的标志动画。

    AI Reveals是一个利用人工智能技术,帮助用户创建动态标志动画的在线工具。它通过用户上传的透明背景标志图片,自动生成具有吸引力的动画效果,增强品牌形象和市场竞争力。该技术的主要优点包括操作简便、效果多样、实时预览等,适合需要快速制作高质量动画的设计师和企业。

  • ChatGPT Folder Master:组织和保存重要ChatGPT对话的终极工具。

    ChatGPT Folder Master 是一款专为Chrome浏览器设计的插件,旨在帮助用户高效地组织和保存与ChatGPT的对话。它通过文件夹和子文件夹系统,让用户能够轻松地对对话进行分类和存档,确保重要信息不会丢失。产品界面友好,易于导航和使用,同时提供安全的本地存储,确保用户对话的隐私和安全。此外,该插件提供月度和终身订阅计划,满足不同用户的需求。

  • Thousand Brains Project:探索大脑智能的AI项目

    Thousand Brains Project是由Jeff Hawkins和Numenta公司发起,旨在通过理解大脑新皮层的工作原理来开发新型的人工智能系统。该项目基于Thousand Brains Theory of Intelligence,提出了与传统AI系统根本不同的大脑工作原理。项目的目标是构建一种高效且强大的智能系统,能够实现人类所具备的智能能力。Numenta公司开放了其研究资源,包括会议记录、代码开源,并建立了一个围绕其算法的大型社区。该项目得到了盖茨基金会等的资金支持,并鼓励全球研究人员参与或加入这一激动人心的项目。

  • Plansom:AI驱动的项目管理工作助手,提升效率。

    Plansom是一款AI驱动的项目管理应用程序,旨在通过简化复杂任务来实现运营卓越。它利用AI技术帮助用户快速创建详细的商业计划,智能分析并优先排序任务,提供AI辅助以解决复杂任务,并支持团队协作和实时跟踪团队进展。用户可以自定义策略模板,以确保组织内的一致性和效率。

  • Xterminal:更高效的开发工具,SSH/控制台/更多功能集成。

    Xterminal是一款集成了SSH、本地控制台、AI赋能命令提示等功能的高效开发工具,旨在为开发者提供更便捷的开发环境。它支持多种操作系统,包括Windows、macOS和Linux,拥有免安装版本和兼容旧版系统的版本,满足不同用户的需求。

  • NIPRGPT:美国空军推出的AI聊天机器人

    NIPRGPT是美国空军为现代化努力的一部分,由空军首席信息官与空军研究实验室合作,加速提供给守护者、空军人员、文职员工和承包商一个负责任地实验生成性人工智能(Generative AI)的平台,同时确保有适当的安全措施。这个平台允许用户进行类似人类的对话以完成各种任务,是一个在安全计算环境中可以回答问题和协助处理通信、背景文件和代码的CAI工具。

今日大家都在搜的词: