首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

AI日报:GPT-4o灰测语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放

2024-07-31 14:57 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI向ChatGPT Plus用户推出高级语音模式

OpenAI宣布推出高级语音模式,提供更自然、实时的对话体验,允许用户打断并感知回应情绪。测试用户将收到电子邮件,计划在秋季让所有Plus用户访问。视频和屏幕共享功能也将推出。GPT-4o经过多语言测试,保护隐私并计划发布评估报告。

【AiBase提要:】

🔊 高级语音模式提供更自然、实时的对话体验,允许用户打断并感知回应情绪。

📧 测试用户将通过电子邮件收到说明,计划秋季全面开放给Plus用户。

🔗 OpenAI计划发布GPT-4o的能力、局限性和安全性评估报告。

2、OpenAI开放新模型gpt-4o-64k-output-alpha,GPT-4o API最长可支持64K 输出

OpenAI推出了新的实验性模型gpt-4o-64k-output-alpha,最大亮点是一次性输出64K长度的token,提供更丰富和详尽的内容,但价格更高。该模型满足用户对更长文本的需求,支持写作、编程和数据分析。长文本生成费用为每百万个输出token18美元,旨在与计算成本匹配,鼓励合理利用工具。

image.png

【AiBase提要:】

📈 GPT-4o模型支持最长64K输出,适合需要详细内容的用户。

💰 长文本生成费用高,每百万个输出令牌收费18美元。

📝 模型推动创作、研究领域的新可能性,促进更深入的交流与创作。

3、Midjourney V6.1版本上线 优化远景人脸,细节更丰富

Midjourney官方推出V6.1版本,带来更智能、更快、更清晰、细节更丰富、更美观的更新。此次更新突破图像连贯性、全面提升画质、精准处理微观细节,优化性能与速度,提高文本准确性,升级个性化模型,新增--q2模式,整体美学提升。

image.png

【AiBase提要:】

✨ 图像连贯性的突破:处理复杂结构更自然流畅,提升创作信心。

🌟 画质的全面提升:减少像素伪影,增强纹理表现力,提供更广阔风格表现空间。

🔍 微观细节的精准把控:处理小图像特征惊人,增强作品真实感与表现力。

详情链接:https://top.aibase.com/tool/midjourneywangyeban

4、小米“大模型小爱”全量升级:支持AI图片编辑等功能

小米公司宣布全新大模型版本的小爱同学即将全面升级,涵盖智能手机、平板电脑、智能电视、智能音箱和汽车等产品线。升级带来创新功能如AI图片编辑和车外唤醒防御。各产品线功能升级将提升用户体验和实用性。

image.png

【AiBase提要:】

🚀 小爱同学全面升级,涵盖多产品线,带来创新功能。

💡 智能手机端专注AI图片编辑、文档问答、智能成片制作。

📺 智能电视端提供影视知识问答、健身休闲指导和家庭计划制定。

5、百度飞桨PaddleX3.0-beta昇腾版发布

PaddleX3.0-beta昇腾版是飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。该版本聚焦7大主流AI场景,提供丰富的模型选择和低代码开发方式,深度适配华为昇腾910芯片,为用户提供便捷的开发范式。

image.png

【AiBase提要:】

🚀 丰富的模型选择,覆盖多个任务场景,包括图像分类、目标检测、文本图像版面分析等

⚙️ 低代码开发方式,统一API接口实现全流程开发,支持用户自定义模型流程串联

💻 深度适配华为昇腾910芯片,满足用户多样化需求

详情链接:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6、AI虚拟换衣模型CatVTON:参数小仅899.06M 支持高分辨率

CatVTON是一款适合时尚爱好者使用的小型AI虚拟换衣模型,拥有轻量级网络和低显存需求,支持高分辨率操作。最新发布的代码和部署流程让用户能轻松在家体验虚拟试妆技术,同时支持在ComfyUI和Gradio应用上部署,操作便捷。

image.png

【AiBase提要:】

🐈 轻量级网络,总参数899.06M,训练参数49.57M,推理时显存需求低于8G,适合个人电脑操作。

💻 支持在ComfyUI上快速部署,简单几步即可体验虚拟试妆技术。

👗 可在VITON-HD和DressCode数据集上进行推理,支持多种精度选项,适应不同硬件条件。

详情链接:https://top.aibase.com/tool/catvton

7、AI换发型神器Stable-Hair:实现发型迁移

Stable-Hair是一项创新的头发转移技术,解决了传统方法无法处理复杂发型的问题,为用户带来全新的试发体验。经过大量实验验证,Stable-Hair在发型转移效果上达到行业领先水平,提升了用户的试发体验。

image.png

【AiBase提要:】

🌟 Stable-Hair解决了传统方法无法处理复杂发型的问题

👨‍🔬 采用两阶段处理流程,先去除头发再进行发型转移

🏆 Stable-Hair在实验中表现出色,达到行业领先水平

详情链接:https://github.com/Xiaojiu-z/Stable-Hair

8、粉丝化身纯爱战士!用AI拥抱相柳引爆社交平台

这篇文章讨论了人工智能技术在虚拟情感表达领域的应用,以热播剧《长相思2》中角色相柳为例,粉丝们通过AI生成的视频与角色互动,展现了一种新颖的情感宣泄方式。然而,文章也提醒人们需警惕过度沉浸在虚拟世界的风险,保持现实生活中的情感平衡。

image.png

【AiBase提要:】

🤖 AI技术助力粉丝用虚拟互动表达情感,创新的视频生成方式引发狂欢

💑 AI情侣合照在社交平台上流行,粉丝实现与偶像亲密接触的梦想

🧠 AI技术深刻影响娱乐领域,提供新颖方式处理对虚构角色的情感依恋

9、Meta关闭明星聊天机器人项目,聚焦AI创作工具AI Studio

Meta最近宣布关闭其明星聊天机器人项目,转向AI Studio,这是一款新工具允许创作者制作自己的聊天机器人。尽管之前投入了大量资金,但明星聊天机器人项目未达预期,Meta仍对AI聊天机器人抱有希望。CEO扎克伯格强调了AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

image.png

【AiBase提要:】

🔥 Meta关闭明星聊天机器人项目,专注于AI创作工具AI Studio。

💰 公司为名人肖像支付高额费用,但项目未达预期。

🤖 CEO扎克伯格强调AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

10、抖音博主“玛珂娜”又出神作!AI续写《童话镇》抽象填词获赞73万

最近,抖音平台上一首由AI重新填词并演唱的《童话镇》引发轰动,赞数超过73万,成为网络热议焦点。AI版本歌词充满抽象意象,演唱出色,引发深度思考。AI创作引发人们对抽象思维、创作逻辑的思考。同时反映了网络文化对新奇内容的追捧,AI创作需理性看待。AI版《童话镇》展示了AI在创意领域可能性,增加公众对AI艺术创作兴趣。

image.png

【AiBase提要:】

⚡ AI重新填词的《童话镇》在抖音引发轰动,赞数超过73万,展示了AI在音乐创作领域的潜力。

🎭 AI版本歌词充满抽象意象,演唱出色,引发人们对AI创造力的深度思考。

🌐 当代网络文化对新奇、幽默内容的追捧,AI创作需理性看待,探索AI创造力的本质和边界。

详情点此了解:https://www.aibase.com/zh/news/10692

11、周鸿祎宣布360安全大模型免费

周鸿祎宣布360集团将免费开放360安全大模型,旨在普及大模型技术,推动安全行业的技术进步和生产力的变革,让更多企业和个人能够负担得起并有效利用大模型技术。

【AiBase提要:】

🔑360集团免费开放360安全大模型,旨在普及大模型技术,推动安全行业技术进步。

💡 对购买360标准产品的用户免费提供大模型标准功能,实现产品功能增强。

🚀360集团成功开发具有千亿级参数的自研通用大模型——360智脑,展现在市场中的影响力和技术实力。

12、雷军称如果没造车多半在干AI:30多年前修了一堆AI课程

雷军在最近的访谈中透露,如果小米没有进入汽车制造领域,公司可能更多地聚焦于人工智能领域。尽管投入造车项目,小米在人工智能方面并未落后行业,早在2016年就开始全面投入AI领域。雷军本人对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

【AiBase提要:】

🚗 小米可能更多聚焦于人工智能领域,若未进入汽车制造领域。

💡 小米在人工智能方面并未落后行业,早在2016年开始全面投入AI领域。

💼 雷军对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

举报

  • 相关推荐
  • 大家在看
  • FlyCode:利用AI优化订阅收入,减少客户流失。

    FlyCode是一款基于机器学习和人工智能技术的应用,旨在通过智能支付重试和优化支付流程来最大化订阅收入并减少客户流失。它为不同规模的品牌提供企业级的收入恢复服务,利用成千上万的数据点来确保尽可能高的恢复率。此外,FlyCode通过与客户电子邮件同步的智能逻辑来改善客户体验,确保在最佳时间和日期发送恢复电子邮件,提高打开率。这些电子邮件是事务性的且可定制的。

  • Coho AI:通过个性化体验,最大化每个用户的收益。

    Coho AI 是一款专注于用户旅程优化和客户留存管理的人工智能平台。它通过分析用户数据,自动发现最有价值的客户,个性化他们的体验,并自动增加每个用户的收入。该平台能够无缝集成到企业的数据中,自动对用户进行细分,识别最佳行动方案,并实时与用户互动,同时跟踪成功并持续优化增长策略。Coho AI 以其无需编码设置、实时行动、简单易用、智能自动化和快速见效等特点,帮助企业提升客户参与度和生命周期价值。

  • Superflex:前端开发助手,提升10倍开发效率。

    Superflex是一款前端开发助理插件,旨在帮助开发者通过各种输入方式快速构建UI组件和页面。它支持从Figma设计、草图、截图或文本提示生成代码,同时分析并重用现有代码库中的组件,以适应开发者的编码风格。Superflex通过VSCode插件的形式提供服务,支持多种输入源生成代码,并且能够适应开发者的编码风格,提供透明的定价策略,旨在帮助开发者提高工作效率,减少重复劳动,专注于创新和复杂问题的解决。

  • 博思AIPPT:AI一键生成PPT,开启做PPT新方式。

    博思AIPPT是一款利用人工智能技术,为用户快速生成PPT演示文稿的在线工具。它通过结构化大纲解析、导入文件、智能排版和AI重写等功能,帮助用户节省大量时间,专注于内容创作。产品背景信息显示,博思AIPPT覆盖全行业场景,包括市场营销、教育、设计等,适用于需要制作演示文稿的各类专业人士。产品提供免费试用,用户可以在线编辑PPT内容,零基础也能快速上手。

  • AI Comic Factory.com:利用AI技术,无需绘画技巧即可创造漫画。

    AI Comic Factory是一个在线AI漫画书生成器,它允许用户通过简单的描述来生成个性化的漫画。这个工具使用尖端的AI技术,使得即使是没有绘画技能的用户也能轻松创作出具有专业视觉效果的漫画。它支持多种漫画风格,包括美国、日本等,并提供多种布局选项。用户可以上传自己的图片,个性化故事,并利用AI保持角色在漫画中的一致性。此外,AI Comic Factory还提供了一个用户友好的界面,让用户能够轻松编辑和精细化他们的漫画作品。

  • 美图证件照:一分钟拍出专业证件照

    美图证件照是由美图秀秀出品的一款专业证件照制作APP,它通过提供多种照片规格和一键上传自拍照的功能,结合智能抠图剪裁、超清美颜和AI换装等技术,让用户可以轻松制作出理想的证件照。这款应用满足了用户在不同场合对证件照的需求,无需前往照相馆,即可在家中完成高质量的证件照制作。

  • Image to Video AI:在线将图片转换成视频的AI工具

    Image to Video AI是一个利用人工智能技术将静态图片转换成动态视频的在线工具。它通过用户上传图片和输入提示文本,快速生成具有动画文本和引人注目的过渡效果的视频。这种技术简化了视频制作流程,使得即使没有视频编辑经验的用户也能轻松创建专业级别的视频内容。产品的主要优点包括易用性、快速生成视频、无需下载安装、支持多种图片格式以及直接分享到社交媒体。

  • PicLumen:免费AI图像生成器,一键生成创意图像。

    PicLumen是一个在线AI图像生成器,它利用先进的人工智能技术,允许用户通过简单的文本输入快速生成高质量的图像。用户无需具备专业的设计技能,只需输入描述性文本,PicLumen的AI就能理解并创造出相应的图像。这个工具特别适合需要快速生成创意图像的个人和商业用户,无论是用于社交媒体内容创作、广告设计还是个人项目。PicLumen提供了多种图像风格,包括动漫、写实艺术、线条艺术和艺术风格,满足不同用户的需求。此外,它还支持图像到图像的个性化编辑,以及AI图像扩展功能,使用户能够无缝扩展图像并智能填充扩展区域。PicLumen的AI图像生成器是完全免费的,适用于个人和商业用途,但用户在使用时需要遵守其使用条款和条件。

  • Microsoft Teams:智能团队协作平台,提升工作效率。

    Microsoft Teams 是一款集成了聊天、会议、通话和协作功能的智能团队协作平台。它通过提供多种AI驱动的功能,如Copilot提示、Mesh虚拟协作和Teams电话服务,帮助团队更高效地沟通和协作。Teams 支持与Microsoft 365应用无缝集成,为不同规模的企业和教育领域提供定制化的解决方案。

  • My Storybook:创作并分享你的故事书

    My Storybook是一个在线平台,旨在帮助所有年龄段的作家创作、出版故事书。它提供写作、插图和角色创建等功能,让学习写作变得有趣。平台还为教师和学生提供教育解决方案,包括无缝的课堂集成和无限打印副本。

  • 阿贝智能:利用AI技术创作个性化儿童绘本

    阿贝智能是一家位于科技与教育交汇点的创新型企业,致力于通过尖端的人工智能技术,开启儿童教育的新纪元。我们相信每个孩子都拥有无限的潜能,而我们的使命是通过科技的力量,解锁这些潜能,帮助孩子们在愉悦的环境中成长和学习。

  • DeepLearning.AI:AI领域的专业课程和资源平台

    DeepLearning.AI 是由著名人工智能专家Andrew Ng创立的在线教育平台,专注于提供机器学习和深度学习领域的高质量课程和专业证书。该平台为初学者和专业人士提供了一个学习AI技能和应用它们的实践机会。通过与行业领导者的合作,DeepLearning.AI 确保了课程内容的前沿性和实用性,帮助学习者在AI领域建立坚实的基础,并推动他们的职业发展。

  • Microsoft Word:智能写作助手,文档设计和协作工具。

    Microsoft Word 是一款强大的文字处理软件,它通过智能写作辅助、文档设计和协作工具,帮助用户提升文档处理的效率和质量。Word 提供了丰富的模板、实时协作编辑、语音输入和命令、以及沉浸式阅读器等功能,支持多种语言,并与 Microsoft 365 其他应用无缝集成,适用于个人和企业用户。

  • ReadLecture:轻松视频转图文,加速内容学习与传播

    ReadLecture 是一款专注于讲座类视频转换为图文结合文档的平台,通过AI技术精准截取视频中的PPT和将演讲者的语言转换为文字稿,大幅提升视频内容的观看效率。该产品通过智能AI笔记生成,提供多维度笔记,包括内容大纲思维导图、自我问答、金句摘抄、专业术语解释、内容翻译等,助力用户高效学习和传播知识。

  • 数美智能文本检测:高效识别各类敏感、违禁、色.情等风险文本内容

    数美科技的智能文本检测产品基于先进的语义模型和海量多语种样本库,能够精准识别并过滤各种敏感、违禁、色.情、暴恐、辱骂、广告导流等风险文本内容。该产品支持多种海外语言检测和风险标签识别,适用于多种应用场景,如文档、帖子、评论、签名、昵称、弹幕等,帮助企业维护网络环境的清洁和安全。

  • 龙源AI检测系统:智能AI写作检测系统,保障文本原创性和学术诚信

    龙源AI检测系统是一款利用大数据和人工智能技术,为学术研究、教育评估、文化传媒等领域提供服务的高科技产品。该系统能够高精度地检测出AI生成的文本和抄袭内容,无论文本长度、类型和语境的限制。系统采用分布式计算和云端部署技术,快速响应和处理大量的文本请求,并自动识别和过滤出有效的文本,提高检测效率和准确度。

  • 知网个人AIGC检测服务:快速、准确识别学术文本中疑似AI生成内容。

    知网个人AIGC检测服务系统利用结构化、碎片化和知识元化的高质量文献大数据资源,结合知识增强AIGC检测技术和多种检测算法,从语言模式和语义逻辑两个维度,使用AI技术检测AIGC生成的内容,旨在帮助用户快速、准确地识别学术文本中的AI生成内容。该服务对于维护学术诚信和提高研究质量具有重要意义。

  • 有道翻译AI写作:一键生成论文、邮件等,提升写作效率。

    有道翻译·AI写作是一款旨在提高写作效率和内容质量的在线工具。它支持一键生成论文、邮件、公文通知、营销文案等,同时提供润色、扩写、总结、去重等高级功能。该产品支持100多种语言,通过多端同步技术,用户可以在不同设备上继续之前的工作,保证了数据的安全性和创作的连续性。

  • 触站AI:AI技术驱动的一站式智能绘画解决方案。

    触站AI绘画是广州触站科技有限公司旗下的一款利用尖端AI技术,为用户打造一站式智能绘画解决方案的平台。它整合了艺术与商业,使用户能够轻松地将想象力转化为现实,提高工作效率,同时开拓更多的商业机会。该平台的应用范围广泛,不仅适用于美术创作、动画制作,还可用于游戏开发、虚拟现实等多领域。

  • Influenbase:AI驱动的TikTok达人营销智能管家

    Influenbase是BrandPal旗下硅谷研发团队打造的AI驱动的TikTok达人营销智能管家。它通过AI算法精细化筛选达人,一键自动与优质达人批量建联,实现从达人建联、合作沟通、物流跟踪、达人视频审核及二次合作等功能,帮助品牌降本增效、实现高质量持续增长。

今日大家都在搜的词: