首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

AI日报:GPT-4o灰测语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放

2024-07-31 14:57 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI向ChatGPT Plus用户推出高级语音模式

OpenAI宣布推出高级语音模式,提供更自然、实时的对话体验,允许用户打断并感知回应情绪。测试用户将收到电子邮件,计划在秋季让所有Plus用户访问。视频和屏幕共享功能也将推出。GPT-4o经过多语言测试,保护隐私并计划发布评估报告。

【AiBase提要:】

🔊 高级语音模式提供更自然、实时的对话体验,允许用户打断并感知回应情绪。

📧 测试用户将通过电子邮件收到说明,计划秋季全面开放给Plus用户。

🔗 OpenAI计划发布GPT-4o的能力、局限性和安全性评估报告。

2、OpenAI开放新模型gpt-4o-64k-output-alpha,GPT-4o API最长可支持64K 输出

OpenAI推出了新的实验性模型gpt-4o-64k-output-alpha,最大亮点是一次性输出64K长度的token,提供更丰富和详尽的内容,但价格更高。该模型满足用户对更长文本的需求,支持写作、编程和数据分析。长文本生成费用为每百万个输出token18美元,旨在与计算成本匹配,鼓励合理利用工具。

image.png

【AiBase提要:】

📈 GPT-4o模型支持最长64K输出,适合需要详细内容的用户。

💰 长文本生成费用高,每百万个输出令牌收费18美元。

📝 模型推动创作、研究领域的新可能性,促进更深入的交流与创作。

3、Midjourney V6.1版本上线 优化远景人脸,细节更丰富

Midjourney官方推出V6.1版本,带来更智能、更快、更清晰、细节更丰富、更美观的更新。此次更新突破图像连贯性、全面提升画质、精准处理微观细节,优化性能与速度,提高文本准确性,升级个性化模型,新增--q2模式,整体美学提升。

image.png

【AiBase提要:】

✨ 图像连贯性的突破:处理复杂结构更自然流畅,提升创作信心。

🌟 画质的全面提升:减少像素伪影,增强纹理表现力,提供更广阔风格表现空间。

🔍 微观细节的精准把控:处理小图像特征惊人,增强作品真实感与表现力。

详情链接:https://top.aibase.com/tool/midjourneywangyeban

4、小米“大模型小爱”全量升级:支持AI图片编辑等功能

小米公司宣布全新大模型版本的小爱同学即将全面升级,涵盖智能手机、平板电脑、智能电视、智能音箱和汽车等产品线。升级带来创新功能如AI图片编辑和车外唤醒防御。各产品线功能升级将提升用户体验和实用性。

image.png

【AiBase提要:】

🚀 小爱同学全面升级,涵盖多产品线,带来创新功能。

💡 智能手机端专注AI图片编辑、文档问答、智能成片制作。

📺 智能电视端提供影视知识问答、健身休闲指导和家庭计划制定。

5、百度飞桨PaddleX3.0-beta昇腾版发布

PaddleX3.0-beta昇腾版是飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。该版本聚焦7大主流AI场景,提供丰富的模型选择和低代码开发方式,深度适配华为昇腾910芯片,为用户提供便捷的开发范式。

image.png

【AiBase提要:】

🚀 丰富的模型选择,覆盖多个任务场景,包括图像分类、目标检测、文本图像版面分析等

⚙️ 低代码开发方式,统一API接口实现全流程开发,支持用户自定义模型流程串联

💻 深度适配华为昇腾910芯片,满足用户多样化需求

详情链接:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6、AI虚拟换衣模型CatVTON:参数小仅899.06M 支持高分辨率

CatVTON是一款适合时尚爱好者使用的小型AI虚拟换衣模型,拥有轻量级网络和低显存需求,支持高分辨率操作。最新发布的代码和部署流程让用户能轻松在家体验虚拟试妆技术,同时支持在ComfyUI和Gradio应用上部署,操作便捷。

image.png

【AiBase提要:】

🐈 轻量级网络,总参数899.06M,训练参数49.57M,推理时显存需求低于8G,适合个人电脑操作。

💻 支持在ComfyUI上快速部署,简单几步即可体验虚拟试妆技术。

👗 可在VITON-HD和DressCode数据集上进行推理,支持多种精度选项,适应不同硬件条件。

详情链接:https://top.aibase.com/tool/catvton

7、AI换发型神器Stable-Hair:实现发型迁移

Stable-Hair是一项创新的头发转移技术,解决了传统方法无法处理复杂发型的问题,为用户带来全新的试发体验。经过大量实验验证,Stable-Hair在发型转移效果上达到行业领先水平,提升了用户的试发体验。

image.png

【AiBase提要:】

🌟 Stable-Hair解决了传统方法无法处理复杂发型的问题

👨‍🔬 采用两阶段处理流程,先去除头发再进行发型转移

🏆 Stable-Hair在实验中表现出色,达到行业领先水平

详情链接:https://github.com/Xiaojiu-z/Stable-Hair

8、粉丝化身纯爱战士!用AI拥抱相柳引爆社交平台

这篇文章讨论了人工智能技术在虚拟情感表达领域的应用,以热播剧《长相思2》中角色相柳为例,粉丝们通过AI生成的视频与角色互动,展现了一种新颖的情感宣泄方式。然而,文章也提醒人们需警惕过度沉浸在虚拟世界的风险,保持现实生活中的情感平衡。

image.png

【AiBase提要:】

🤖 AI技术助力粉丝用虚拟互动表达情感,创新的视频生成方式引发狂欢

💑 AI情侣合照在社交平台上流行,粉丝实现与偶像亲密接触的梦想

🧠 AI技术深刻影响娱乐领域,提供新颖方式处理对虚构角色的情感依恋

9、Meta关闭明星聊天机器人项目,聚焦AI创作工具AI Studio

Meta最近宣布关闭其明星聊天机器人项目,转向AI Studio,这是一款新工具允许创作者制作自己的聊天机器人。尽管之前投入了大量资金,但明星聊天机器人项目未达预期,Meta仍对AI聊天机器人抱有希望。CEO扎克伯格强调了AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

image.png

【AiBase提要:】

🔥 Meta关闭明星聊天机器人项目,专注于AI创作工具AI Studio。

💰 公司为名人肖像支付高额费用,但项目未达预期。

🤖 CEO扎克伯格强调AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

10、抖音博主“玛珂娜”又出神作!AI续写《童话镇》抽象填词获赞73万

最近,抖音平台上一首由AI重新填词并演唱的《童话镇》引发轰动,赞数超过73万,成为网络热议焦点。AI版本歌词充满抽象意象,演唱出色,引发深度思考。AI创作引发人们对抽象思维、创作逻辑的思考。同时反映了网络文化对新奇内容的追捧,AI创作需理性看待。AI版《童话镇》展示了AI在创意领域可能性,增加公众对AI艺术创作兴趣。

image.png

【AiBase提要:】

⚡ AI重新填词的《童话镇》在抖音引发轰动,赞数超过73万,展示了AI在音乐创作领域的潜力。

🎭 AI版本歌词充满抽象意象,演唱出色,引发人们对AI创造力的深度思考。

🌐 当代网络文化对新奇、幽默内容的追捧,AI创作需理性看待,探索AI创造力的本质和边界。

详情点此了解:https://www.aibase.com/zh/news/10692

11、周鸿祎宣布360安全大模型免费

周鸿祎宣布360集团将免费开放360安全大模型,旨在普及大模型技术,推动安全行业的技术进步和生产力的变革,让更多企业和个人能够负担得起并有效利用大模型技术。

【AiBase提要:】

🔑360集团免费开放360安全大模型,旨在普及大模型技术,推动安全行业技术进步。

💡 对购买360标准产品的用户免费提供大模型标准功能,实现产品功能增强。

🚀360集团成功开发具有千亿级参数的自研通用大模型——360智脑,展现在市场中的影响力和技术实力。

12、雷军称如果没造车多半在干AI:30多年前修了一堆AI课程

雷军在最近的访谈中透露,如果小米没有进入汽车制造领域,公司可能更多地聚焦于人工智能领域。尽管投入造车项目,小米在人工智能方面并未落后行业,早在2016年就开始全面投入AI领域。雷军本人对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

【AiBase提要:】

🚗 小米可能更多聚焦于人工智能领域,若未进入汽车制造领域。

💡 小米在人工智能方面并未落后行业,早在2016年开始全面投入AI领域。

💼 雷军对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

举报

  • 相关推荐
  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

    小米手表S4 eSIM版与S4 Sport版正式上线,用户连接小米手机后可通过中国移动“一号双终端”业务实现手表与手机共享号码的便捷通信。目前云南、四川两省暂未开放,其他地区用户可通过小米运动健康App在线自助办理。办理需确保手表与手机连接,并在手表设置中开启移动网络开关,待eSIM数据传输完成后即可使用全部功能。其他支持eSIM的小米手表产品也在逐步认证中,未来将陆续开放服务。

  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�

  • 真我GT8 Pro阿斯顿马丁F1限量版正式开售 售价5499元

    真我GT8 Pro阿斯顿马丁F1限量版于11月10日开售,售价5499元。配备16GB+1TB顶配内存,外观融入F1赛车元素,采用标志性青绿色和专属设计,包装盒含赛车主题配件。UI深度定制,拥有专属开机动画和相机水印。配置包括6.79英寸2K直屏、高通骁龙8至尊版平台、7000mAh电池,支持120W有线及50W无线闪充。影像系统搭载5000万像素主摄及2亿像素潜望长焦,支持多种胶片滤镜。具备满级防尘防水和超声波屏下指纹,综合性能强劲,专为科技与赛车爱好者打造跨界盛宴。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 华为Mate 70 Air配置价格公布:可选CPU 售价4199起

    华为Mate70 Air于11月6日10:08开启预售,提供麒麟9020B和9020A两款CPU版本,价格从4199元至5199元。机身仅6.6mm厚、208g重,配备7英寸OLED临境大屏,支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头,内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7,预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置,有望引发市场关注。

  • iPhone Pocket被吐槽像保温水瓶套 网友:韭菜太好割

    苹果联合日本设计师品牌三宅一生推出iPhone Pocket配件,售价1299元。产品采用3D针织工艺,支持七种佩戴方式,但被质疑与普通手机套功能无异。社交媒体上“1299元买块会变形的布”引发热议,消费者对比9.9元帆布手机套直指苹果收割粉丝。支持者认为定价符合奢侈品逻辑,反对者则拒绝为设计概念支付溢价。该产品在设计价值与实用功能间引发两极争议。

  • 从巴别鱼到技术突围:W4Pro以体验领先定义跨语言沟通新标杆

    时空壶W4Pro开放式AI同传耳机通过技术创新,将科幻构想变为现实产品。在跨语言沟通核心指标上实现双重突破:响应延迟仅0.2秒,较行业平均提速75%;翻译延迟控制在3秒内,实测平均2.8秒,较竞品提速38%-53%。搭载骨声纹识别+矢量降噪双技术方案,在85分贝嘈杂环境中语音识别准确率仍保持98%以上。支持43种语言及96种口音实时互译,覆盖全球98%主流区域,新增孟加拉语等小语种适配。单设备即可实现双向跨语言交流,打破多数竞品需配对使用的局限。单次充电支持6小时翻译使用,综合续航达18小时,开放式挂耳设计仅重12克。该产品精准解决了跨语言沟通中的延迟、降噪、场景适配等核心痛点,推动行业向"无感沟通"迈进。

  • 增长22.48%!海尔智家5年利润复合增长率TOP3最高

    三季度家电企业财报显示,海尔智家、美的集团表现突出。海尔连续多季度实现营收利润双增,Q3归母净利润增12.7%;美的营收增10.06%。其成功源于三方面:持续打造爆款产品如“懒人系列”洗衣机;数字化变革降本提效,费率优化0.2个百分点;深耕全球本土化运营,海外收入前三季度累计增10.5%。海尔通过创新与效率提升,在激烈市场竞争中保持领先地位。

  • 苹果新配件iPhone Pocket 1299元起售

    苹果公司与三宅一生合作推出iPhone收纳包配件“iPhone Pocket”,11月14日正式发售。产品以“一块布”为设计灵感,采用3D针织一体结构,适配所有iPhone型号,可收纳钥匙、卡片等小物,支持手提、系包或贴身佩戴。短带款售价1299元(八色可选),长带款1899元(三色可选)。高定价引发争议:部分用户赞赏其设计独特性,认为联名值得购买;更多网友质疑性价比,称其为“智商税”。产品命名因与华为折叠屏手机“华为Pocket”相近,一度引发消费者误解,相关话题冲上热搜。

今日大家都在搜的词: