首页 > 原创 > 关键词  > AI模特最新资讯  > 正文

AI日报:可灵AI上线AI模特功能;字节今年AI投入近BAT总和;ChatGPT本月第二次大规模宕机;抖音引入音频审核大模型

2024-12-27 15:17 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、可灵AI深夜放大招!悄悄上线AI模特功能

可灵AI最近推出了革命性的AI模特功能,标志着电商行业视觉展示的重大变革。新版本的可图模型在语义理解和真人效果上有了显著提升,尤其适合亚洲人像。用户可以通过简单的设置快速生成高质量的AI模特图,并与AI换衣功能无缝合,极大提高了服装展示的便捷性和效率。

QQ20241227-111522.jpg

【AiBase提要:】

🌍 AI模特功能结合可图1.5,用户可快速生成高质量模特图,提升电商视觉展示。

👗 AI模特与AI换衣无缝整合,用户可直接生成穿着新衣的模特图,操作便捷。

🎥 AI视频功能允许模特动态展示服装,降低成本,提高效率,助力小商家与大品牌竞争。

2、消息称字节跳动AI投资接近BAT总和,明年预算翻倍!

消息称字节跳动正在加大在人工智能领域的投资,2024年资本开支预计达到800亿元,接近百度、阿里巴巴和腾讯三巨头的总和。到2025年,这一数字将翻倍至1600亿元,重点将放在AI算力的采购上。创始人张一鸣亲自参与人才招募,旨在实现“通用人工智能”的目标。

【AiBase提要:】

💼 巨额资本开支: 字节跳动2024年AI资本开支达800亿元,接近BAT总和。

🚀 预算翻倍计划: 预计2025年资本开支将增至1600亿元,重点投资AI算力。

🧠 AI人才战略: 张一鸣亲自招募AI人才,追求“通用人工智能”目标。

3、ChatGPT 本月第二次大规模宕机

OpenAI的AI服务在12月27日凌晨遭遇中断,影响了ChatGPT、Sora视频生成模型及部分API调用。虽然在早上6点05分部分恢复,但聊天历史记录加载功能仍受限,完全恢复时间尚未确定。OpenAI表示中断是由上游提供商引起,而微软Azure也报告了数据中心的电源问题。

image.png

【AiBase提要:】

⚠️ OpenAI的AI服务在12月27日凌晨遭遇中断,影响多个功能。

🔧 早上6点05分部分恢复,但聊天历史记录加载功能仍受限。

🔌 中断原因与微软Azure的数据中心电源问题有关。

4、百度文心快码上线无障碍版本

百度AI最近推出的文心快码无障碍版本,旨在帮助视障IT从业者克服编程中的挑战,提升工作效率。该工具通过将代码转换为自然语言,使视障人士能够更轻松地理解和修改代码。文心快码的发布不仅体现了技术的进步,也展示了百度在推动社会包容性方面的努力,为特殊群体提供了实质性的支持。

image.png

【AiBase提要:】

🛠️ 文心快码无障碍版通过自然语言处理技术,帮助视障人士更好地理解和编写代码。

👩‍💻 该工具支持用户用自然语言描述需求,快速生成可运行代码,极大提高开发效率。

🌍 文心快码的发布体现了百度在促进社会包容性和技术温暖人心方面的努力。

5、小米澎湃OS2AI助手超级小爱将首次向正式版用户开放

在即将到来的年度总结直播中,小米总裁卢伟冰将介绍小米澎湃OS2的重大更新,特别是超级小爱功能的首次开放。此次更新不仅提升了用户体验,还展现了小米在AI助手领域的创新。超级小爱作为小爱同学的进化版,具备记忆能力和安全保障,致力于为用户提供智能、便捷的交互体验。

image.png

【AiBase提要:】

超级小爱功能首次向正式版用户开放,标志着澎湃OS2的重大升级。

🔒 所有数据实现端到端加密,确保用户信息安全和隐私保护。

📅 超级小爱具备记忆能力,能帮助用户记录日程和个人偏好。

6、大众点评内测 AI 推荐工具 “点仔” 智能推荐餐厅与菜品

美团大众点评推出的AI智能工具“点仔”旨在为用户提供个性化的餐饮推荐服务。通过集成多项功能,如“找店帮手”、“菜品搭配”和“景点伴游”,用户可以轻松输入需求,快速找到合适的餐厅和推荐菜品。此外,“点仔”还具备AI帮写功能,帮助用户撰写高质量的点评。

image.png

【AiBase提要:】

🔍 提供个性化餐饮推荐,简化用户决策过程。

🍴 结合用户评价,智能推荐餐厅和菜品,提升点餐体验。

🖋️ AI帮写功能辅助用户撰写点评,提高内容质量和效率。

7、智谱AI开源Agent任务模型CogAgent-9B:通过屏幕截图预判操作

智谱AI推出的CogAgent-9B是一个开源的Agent任务模型,旨在通过屏幕截图来预测用户的下一步操作。该模型基于GLM-4V-9B训练,具有广泛的应用场景,包括个人电脑和手机等设备。与之前版本相比,CogAgent-9B在GUI感知和推理准确性等方面有显著提升,并支持中英文双语交互。

image.png

【AiBase提要:】

🖼️ CogAgent-9B通过屏幕截图和用户指令预测下一步GUI操作,适用于多种设备。

📈 相比于第一版,CogAgent-9B在准确性、普适性和泛化性上有显著提升,支持中英文交互。

🔧 该模型的输出包括思考过程和下一步动作的描述,展现了在GUI定位和操作上的优势。

详情链接:https://github.com/THUDM/CogAgent

8、2024抖音直播治理报告:引入音频审核大模型 强化治理违规内容

抖音集团发布的2024年直播治理报告展示了其在直播领域的治理理念与成果。通过引入音频审核大模型和完善主播管理机制,抖音致力于构建一个安全、可信的网络直播环境。报告中提到,主播健康分制度的实施显著降低了违规率,同时与警方的合作也加强了对线下违法行为的打击。

【AiBase提要:】

🔍 抖音推出“健康分”制度,100万主播被扣分,76%的低分主播主动调整内容,违规率显著下降。

🤖 引入音频审核大模型,逐步实现违规内容的自动识别与处置,提升治理效率。

🛡️ 升级未成年人保护机制,快速退款机制有效保护未成年人,联动城市治理减少违规行为。

9、北京市新增11款已完成备案的生成式AI服务

根据“网信北京”微信公众号的消息,截至12月27日,北京市新增11款已完成备案的生成式人工智能服务,累计备案数量达到105款。这些新增服务包括清影AI、小米端侧文本和小米澎湃图像等。所有上线的生成式人工智能应用或功能,需在显著位置公示所使用的已备案服务情况,包括模型名称和备案编号,以确保透明度和合规性。

image.png

【AiBase提要:】

📝 新增11款生成式AI服务,累计备案达105款。

📱 新增服务包括清影AI、小米端侧文本和小米澎湃图像。

🔍 上线应用需公示使用的备案服务情况,确保透明合规。

10、理想汽车旗下AI应用理想同学App正式上线

理想汽车推出的理想同学App现已在苹果App Store和小米应用商店上线,旨在为用户提供智能交互服务。该应用依托于理想汽车自研的大模型,具备识物、知识问答、翻译等多种功能。CEO李想强调,真正的人工智能应能自主使用各种设备,并满足用户需求。理想同学的上线不仅提升了用户体验,也推动了人工智能技术的发展。

微信截图_20241227080342.png

【AiBase提要:】

🛠️ 理想同学App在iOS和安卓平台正式上线,提供丰富的智能交互功能。

👶 许多用户的孩子通过与理想同学的互动解决了学习问题,显示出其教育价值。

🚀 理想同学App的发布为人工智能技术的普及和发展开辟了新道路。

11、OpenAI与微软秘密协议曝光,AGI被标价1000亿美元

根据最新报告,微软和OpenAI对人工通用智能(AGI)有一个基于利润的具体定义,认为只有当OpenAI的AI系统能够产生至少1000亿美元的利润时,才算实现AGI。尽管OpenAI预计今年将亏损数十亿美元,并在2029年前不会盈利,这一协议可能让微软在未来十年内持续使用OpenAI的技术。

【AiBase提要:】

💰 微软和OpenAI将AGI定义为能产生至少1000亿美元利润的AI系统。

📉 OpenAI预计今年将亏损数十亿美元,预计2029年前不会盈利。

🤖 微软可能在未来十年或更长时间内都能使用OpenAI的技术。

12、大材小用!Anthropic:大多数任务无需复杂AI智能体

Anthropic的最新分析指出,实际应用中使用AI智能体的场景并不常见,且在许多任务中,简单的提示往往更有效。该公司强调,尽管AI智能体可以处理复杂任务,但它们需要更多的监管和计算能力。建议团队从基本提示开始,逐步增加复杂性,并关注设计的简单性、流程的透明性以及用户界面的精心设计。

【AiBase提要:】

🤖 大多数任务不需要复杂的AI智能体。

🔍 从基本提示开始,仅在必要时增加复杂性。

🛠️ 客户服务和软件开发是AI智能体最有潜力的领域。

举报

  • 相关推荐
  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 可灵AI离营收单月破亿,还有多远?

    虽然嘴上没明说,但快手显然也不想在AI时代仍甘当短视频老二。 因此,如今快手的财报会议上,AI占据了越来越多的篇幅,当然关键还是可灵AI的确争气。 根据快手2025年一季度财报显示,可灵AI营收超过1.5亿元人民币。从2024年9月的单月千万流水,到2025年第一季度的季度1.5亿营收,换言之,7个月时间里可灵AI实现15倍的营收增长。

  • 苹果高管:我们的AI聊天机器人,足以媲美ChatGPT最新版本!

    据员工透露,苹果目前内部测试的聊天机器人在过去六个月里取得了重大进展,某些高管甚至认为它已赶上了 ChatGPT 的最新版本……

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。