首页 > 业界 > 关键词  > openAI最新资讯  > 正文

AI视野:OpenAI灰度测试GPT4.5;Midjourney V6模型下周发布;Gemini自曝中文用文心一言训练;LeCun提出AGI七阶段路线图

2023-12-18 15:05 · 稿源:站长之家

📰🤖📢AI新鲜事

openAI灰度测试GPT4.5

近日,OpenAI正在对最新的GPT4.5turbo模型进行灰度测试,该模型在文本生成质量、效率、上下文理解、多模态能力、编程和代码生成、安全性、个性化定制等七个方面都取得显著进展。

QQ截图20231218093444.jpg

【AiBase提要】:

🚀 性能提升: GPT4.5turbo在保持生成质量的同时,通过优化计算效率实现更高的响应速度,尤其在处理大型数据集和复杂查询时表现卓越。

🌐 多方面增强: 该模型在上下文理解、多模态能力、编程和代码生成等方面均取得显著进展,展现了更出色的能力。

🔐 安全性提升: OpenAI进一步增强了模型的安全性和对不饱和内容的过滤能力,以降低误用风险。

Gemini自曝中文用文心一言训练

Gemini-Pro在谷歌Vertex AI平台上自称为百度文心大模型,引发网友疑虑。实测发现,中文对话时坚称是文心一言,但使用英文则承认是谷歌训练的大模型。谷歌Gemini-Pro在百度文心一言训练下,引发用户关切,究竟是大公司互相薅羊毛还是深层次技术交流?

image.png

【AiBase提要:】

🤖 Gemini-Pro在中文对话中自称百度文心,引发用户疑虑。

🔄 使用英文对话时,Gemini-Pro承认是谷歌训练的大模型。

❓ 引发关注,是否代表大公司间存在深层次的技术交流?

Midjourney V6模型下周发布

经过半年等待,Midjourney V6模型即将发布,社区评价显示在复杂画面信息还原和内容绘制上有显著提高。

【AiBase提要】

🚀 技术升级: Midjourney V6模型将支持更复杂内容的绘制,社区评价显示在还原画面和内容方面有大幅提高。

💻 评价流程: 社区风格评价中,随机展示V6模型生成的两张图片,参与者选择最喜欢的一张,展示V6模型的质量。

📈 期待升级: 预计V6版本将在圣诞节前发布,为人工智能艺术领域带来新的突破。

字节跳动澄清“OpenAI服务被禁”

字节跳动近期被报道使用OpenAI技术涉嫌违反服务条款,导致账户被封禁。公司负责人澄清违规行为为早期实验性项目的偶发行为,已于4月停止,并在9月进一步采取措施以符合规范。公司表示将在未来几天进行全面排查,以确保严格遵守OpenAI相关服务的使用条款。

【AiBase提要:】

🚨 违规实验: 字节跳动负责人澄清违规行为为早期实验性项目的偶发行为,已在4月停止。

🔄 规范措施: 公司在9月采取措施,确保对OpenAI的API调用符合规范要求。

🔍 全面排查: 字节跳动表示将在未来几天再次全面排查,以确保严格遵守相关服务的使用条款。

LeCun提出AGI七阶段路线图

OpenAI推出「登月计划」,解决超级AI对齐问题,LeCun提出AGI七阶段发展路线图,强调构建学习世界运作方式的系统是首要任务。

论文地址:https://ai.meta.com/blog/yann-lecun-ai-model-i-jepa/

【AiBase提要】

🌐 小模型监督大模型: OpenAI超级对齐团队提出通过小模型监督大模型解决超级AI对齐问题,为超级人工智能的发展奠定基础。

🧠 LeCun的世界模型: LeCun强调构建学习世界运作方式的系统,提出"世界模型"架构,解决当前大模型局限性,迈向通用AGI。

🚀 AGI七阶段发展路线图: LeCun提出AGI发展七阶段,从学习世界运作到超越人类

OpenAI否认与Jony Ive合作开发AI设备

OpenAI首席执行官Sam Altman在接受采访时否认与前苹果设计总监Jony Ive合作开发AI设备。Altman强调OpenAI不参与智能手机市场竞争,对消费硬件的探索仍处于早期阶段。传言中Jony Ive和Altman合作开发的项目细节尚不确定,使得苹果可以放心。

【AiBase提要:】

🤖 Altman否认合作: OpenAI首席执行官Sam Altman否认与Jony Ive合作开发人工智能设备,强调公司不涉足智能手机市场。

🚀 硬件探索初期: Altman表示,OpenAI对消费硬件的探索仍处于早期阶段,项目细节尚不确定。

🤔 传言未证实: 关于传言中的合作项目,Altman未透露具体细节,保持了项目的神秘性。

🤖📈💻💡大模型动态

中国科大发布SciGuard大模型

中国科大等机构发布SciGuard和SciMT-Safety,通过SciGuard大型语言模型驱动的agent,保护AIforScience模型免受滥用风险,并建立首个专注于化学科学领域安全的基准测试。

image.png

论文地址:https://arxiv.org/pdf/2312.06632.pdf

【AiBase提要:】

🛡️ SciGuard保护AI科学模型: SciGuard是大型语言模型,通过智能体控制AI在科学领域的滥用风险,构建记忆库评估风险并提供安全建议。

🧪 科学风险基准建立: 研究团队创建了SciMT-Safety,首个专注于化学科学领域安全的基准测试,用于评估不同AI系统的安全性。

🚀 全球呼吁强化AI监管: 实验证明SciGuard在测试中表现出最小的有害影响,研究团队呼吁全球科技界、政策制定者、伦理学家加强对AI技术的监管,确保科技进步符合人类利益。

🤖📱💼AI应用

腾讯讯云推出高性能应用服务HAI

腾讯云推出HAI高性能应用服务,无需繁琐配置,用户仅需10分钟即可建立自己的AI应用,助力中小企业、开发者和个人用户快速部署高性能应用。

 10 分钟创建AIGC应用,腾讯云推出高性能应用服务HAI

【AiBase提要】

🚀 即插即用服务: HAI提供即插即用的算力和常见环境,支持快速部署语言模型、AI作画、数据科学等高性能应用,降低开发门槛。

💡 智能云资源匹配: HAI根据应用智能匹配最优的云资源,无需选择众多GPU服务器,一键部署方法快速构建环境,大幅提高开发效率。

🎨 多样化应用环境: HAI提供多种预装模型环境,支持自定义部署最新的开源模型,通过可视化界面为开发者提供友好的图形化交互视图,支持多种算力连接方式。

AI图片处理工具Inpaint-web 支持高清修复和图片局部清除

Inpaint-web是一款无需下载客户端的AI图片处理工具,通过WebPGU在浏览器上直接运行。主要支持图片局部清除和将模糊的图片变成高分辨率清晰图。用户可以方便修复图像缺陷、提高图像质量,未来将引入更多功能,完全免费开源。

image.png

项目地址:https://top.aibase.com/tool/inst-inpaint

在线测试地址:https://t.co/Env6tMNW0u

【AiBase提要:】

🌐 在线操作: Inpaint-web通过WebPGU在浏览器上运行,无需下载客户端。

📷 功能丰富: 支持图片局部清除和高清修复,未来将引入图像放大等功能。

🆓 免费开源: Inpaint-web完全免费开源,为用户提供方便快捷的图片处理解决方案。

Novel:一款Notion风格编辑器 搭载AI智能自动补全功能

Novel是一款开源WYSIWYG编辑器,采用Notion风格,通过强大的AI智能自动补全功能提供直观编辑体验,加速文字创作过程。

image.png

项目地址:https://top.aibase.com/tool/novel

【AiBase提要】

🌐 WYSIWYG编辑体验: Novel提供类似Notion的直观编辑界面,实时渲染效果,提高编辑效率。

🧠 AI智能自动补全: 利用OpenAI技术,Novel为用户提供智能自动补全建议,加速文字创作过程。

🚀 易用的安装和集成: 通过NPM包形式提供,简便安装,可轻松集成到现有项目中,支持本地部署和云端。

H&R Block与微软合作推出AI报税助手

全球最大税务机构H&R Block与微软合作推出AI报税助手,通过文本问答实现快速报税、退税,每月35美元的费用覆盖500万用户,准确率100%

图片

产品体验地址:https://www.hrblock.com/online-tax-filing/

【AiBase提要:】

🤖 技术支持与数据保障: H&R Block与微软合作推出的AI Tax Assist得到微软Azure OpenAI的技术支持,使用近70年的税务数据进行预训练和微调,确保准确率100%

💼 服务规模和费用: 该助手每月35美元,已正式为超过500万用户提供服务,支持7*24小时无间断服务,覆盖快速报税、退税、税收管理等业务。

📈 行业影响力与数字化趋势: H&R Block作为全球最大税务服务机构之一,通过AI报税助手展示了税务行业数字化趋势,提高了工作效率并满足用户需求。

👨‍💻💡🎯聚焦开发者

EPFL与苹果联手开源人工智能框架4M

瑞士洛桑联邦理工学院(EPFL)与苹果合作推出的4M框架通过Transformer技术实现跨多模态训练,提高模型灵活性和可扩展性,成功解决了视觉领域多模态训练的挑战。

image.png

项目体验网址:https://4m.epfl.ch/

论文网址:https://arxiv.org/abs/2312.06647

【AiBase提要:】

🌐 多模态挑战: 在自然语言处理领域大型语言模型取得成功的同时,视觉领域需要更灵活可扩展的多模态基础模型。

🤖4M框架: EPFL与苹果提出的"Massively Multimodal Masked Modeling"(4M)框架整合了Transformer技术,具备强大的跨模态能力,通过模态特定的标记器提高兼容性、可扩展性。

🚀 可扩展性与效率:4M通过输入和目标掩码实现高效训练,同时采用模态特定的标记器将各种输入模态转换为离散标记的集合,使单一Transformer能同时处理多种输入模态。

举报

  • 相关推荐
  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • OpenAI披露GPT系列新进展,微美全息(WIMI.US)正加速AI技术融合与产业变革

    OpenAI创始人Sam Altman宣布将推出开源大模型,性能远超业界预期,其强大的本地运行能力将极大推动AI技术普及。同时透露GPT-5将于今夏面世,支持语音、图像、代码等多模态输入。AI模型成本持续下降,微美全息等企业加速布局"AI+大模型"创新应用。中金指出,未来AI发展将呈现两大趋势:垂直领域定制化Agent需求增长,以及高质量场景数据价值凸显。2025年被视为AI应用大规模落地元年,但技术发展需兼顾创新与安全。

  • 王腾:REDMI Turbo 4 Pro非常成功 很多友商都在关注

    REDMI总经理王腾发文表示,REDMI上半年发布的Turbo 4 Pro非常成功,受到了广大用户的喜爱,也收到了很多友商的关注。 据悉,REDMI Turbo 4 Pro于4月份发布,首发起售价是1999元,该机上市不到一个月累计销量突破100万台,成为行业内最火的Turbo手机。 随着REDMI Turbo系列的热销,各大品牌纷纷推出Turbo系列手机,主打高性能,对此王腾表示,领先的一种体现就是被模仿,说明REDMI这几�

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • 分析师称MacBook Pro将升级OLED屏:Mini LED退场

    Omdia分析师Linda Lin在一份研究报告中重申,首批搭载OLED屏幕的MacBook将于2026年问世。 尽管她未特别提及MacBook Pro,但业界普遍认为,OLED屏将率先在高端MacBook Pro上首发,随后才会应用到价格更低的MacBook Air系列上。 当前MacBook Pro使用的是Mini LED屏,这块屏升级了液晶层背光,把背光中的LED灯小型化,本质上仍然是LCD屏幕,每个LED灯珠尺寸约在50-200um之间,让背光层拥有更多的背�

  • 刷屏世俱杯的RGB-Mini LED有多能打?央视拆机探秘看球黑科技

    海信在2025世俱杯期间展示了其RGB-Mini LED电视技术,通过红绿蓝三原色独立背光光源实现更纯净色彩和更高能效。相比传统电视需要二次色彩转换,该技术直接呈现原色,解决了拖影、色偏等问题,能效提升20%以上。海信通过自主研发的AI画质芯片和RGB背光芯片,攻克了三原色同步控制等技术难题。该技术已应用于85-116英寸大屏电视,成为行业认可的下一代显示方向,标志着中国显示技术从跟随到引领的跨越。