首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

AI日报:性能超GPT-4!通义千问2.5发布;Udio可局部编辑音轨;Dreamina正式更名为“即梦”;OpenAI探索允许用户“负责任” 地制作AI色情内容

2024-05-09 14:50 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解https://top.aibase.com/

1、阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo

阿里云今日发布通义千问2.5版本,该版本在模型性能上超越了GPT-4Turbo,展现强大技术实力。通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得卓越成绩,超越了Meta的Llama-3-70B模型。通义千问2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有显著提升。

image.png

【AiBase提要:】

🚀 通义千问2.5版本性能超越GPT-4Turbo,展现技术实力。

🌟 Qwen1.5-110B模型在多个基准测评中表现出色,超越Meta的Llama-3-70B模型。

💡 通义千问多模态模型和专有能力模型展现卓越能力,如Qwen-VL-Max和CodeQwen1.5-7B。

2、Dreamina正式更名为“即梦” AI绘画和AI视频功能全量上线

Dreamina官方宣布更名为中文「即梦」,并全量上线AI作图和AI视频生成功能。用户可通过新域名体验功能。即梦致力于通过AI技术实现艺术创作和故事讲述,展现出色生成效果,但细节重绘功能仍需提升。

image.png

【AiBase提要:】

✨ 文生图: AI将文字描述转化为图片,助用户智能艺术创作。

🎨 智能画布: 交互式画布,轻松抠图重组图像,重新绘制新图像。

📹 文生视频: 文字描述转换成视频,拓宽AI创作边界。

详情链接:https://top.aibase.com/tool/jimengdreamina

3、腾讯测试两款全新社交产品APP轻团、代号N1

腾讯近期推出的两款新社交产品轻团和代号N1,分别结合了地图社交和MBTI人格类型理论模型,更贴合年轻人的需求。这些新产品为用户提供了更多个性化的社交体验,包括地图找人、虚拟身份穿搭和MBTI标签获取等功能。腾讯通过引入这些新特性,可能在年轻人社交市场上找到新的突破口。

image.png

【AiBase提要:】

🗺️ 轻团是地图社交产品,用户可通过地图找人和加入兴趣圈子,创建虚拟身份和穿搭时装。

🔍 代号N1 集成了MBTI和朋友圈功能,用户可分享动态、参与内容创作,通过MBTI测试获取标签。

🎯 腾讯新产品更贴合年轻人需求,引入地图找人和MBTI功能,提供个性化社交体验。

4、Udio推出Audio Inpainting功能 可无缝编辑优化音轨

Udio最新推出的Audio Inpainting功能为用户提供了无缝编辑和优化音轨的创新工具,让用户可以重新生成音轨的特定部分,实现平滑过渡和纠正错误。同时,Udio也更新了收费政策和增加了个性化功能,体现了对用户需求的重视。

image.png

【AiBase提要:】

⭐ Udio推出新功能Audio Inpainting,可无缝编辑优化音轨

⭐ 可重新修改某个片段歌词并重新生成音轨,新生成音轨可与原音轨无缝衔接

⭐ Udio开始收费,标准会员每月 10 美元送 1200 个积分,高级会员每月 30 美元送 4800 个积分

产品入口:https://top.aibase.com/tool/udio

详细视频在此查看:https://www.chinaz.com/2024/0509/1615216.shtml

5、Freepik 收购AI 图像放大工具Magnific

这篇文章报道了全球领先的设计平台Freepik收购AI图像放大、增强和转换工具Magnific的消息。这一战略性收购将为Freepik的AI产品线带来丰富和创新体验,加速其在全球扩张计划中的发展。

【AiBase提要:】

✨ Freepik完成收购Magnific,拓展AI工具套件,加速全球扩张。

💡 Magnific是领先的AI图像处理工具,提升图像质量和分辨率,允许用户创造性控制和添加新细节。

🚀 Magnific创始人将加入Freepik团队,共同推动AI解决方案发展,为设计社区带来创新体验。

6、AI插画生成器Ilus AI:可快速生成涂鸦、扁平化插画

Ilus AI是一款先进的AI插画生成器,能够快速生成各种风格的插画,大大缩短设计时间,提供个性化创作方式。它支持预制模型生成插画,还允许用户自定义训练,满足多样化需求。生成的插画可导出为SVG和PNG格式,灵活适用于不同场景。Ilus AI为设计师、艺术家和非专业用户提供了强大的创作工具,预示个性化设计服务未来趋势。

image.png

【AiBase提要:】

✨ 创新AI插画生成器,快速生成各种风格插画,缩短设计时间。

🎨 支持预制模型和自定义训练,满足用户多样化需求。

🖼️ 插画导出为SVG和PNG格式,灵活适用于不同场景。

详情链接:https://top.aibase.com/tool/ilus-ai

7、阿里云:通义千问API日调用量破亿

阿里云在今日的AI智领者峰会上宣布,通义千问的日调用量突破亿次,企业用户数超过9万家,开源模型下载量达到700万次。通义千问在性能和精准度方面表现卓越,接近GPT4,尤其在中文知识问答和长文本处理方面突出。阿里云展示了强大的AI实力,通义千问将继续引领行业创新,提供优质高效服务。

【AiBase提要:】

🚀 通义千问API日调用量突破亿次,企业用户数超过9万家,开源模型下载量达到700万次。

💡 通义千问性能逼近GPT4,在中文知识问答和长文本处理方面表现出色,提供优质体验。

⚙️ 通义千问支持处理1000万字文档,同时处理多达100个文档,支持多种文档格式处理,提高工作效率。

8、德克萨斯大学开发出可拉伸电子皮肤 机器人马上就要有仿真皮肤了

德克萨斯大学奥斯汀分校的研究人员开发了一种创新的可拉伸电子皮肤(e-skin),赋予机器人与人类皮肤相似的柔软度和触觉灵敏度,突破了现有技术的难题,保持压力响应稳定。该技术具有人类级别的触觉灵敏度,混合传感器技术,广泛的应用场景,灵活的探针和抓手,创新的传感器结构。

【AiBase提要:】

🤖 电子皮肤赋予机器人与人类皮肤相似的柔软度和触觉灵敏度

🤖 电子皮肤压力感应能力保持稳定,确保精确的感知能力

🤖 电子皮肤可在医疗领域辅助执行复杂的护理任务,以及在灾难救援中搜索受伤者并提供急救

9、SDXL Controlnet线条模型MistoLine发布

MistoLine是一个SDXL-ControlNet模型,在处理各种线条艺术作品方面表现出卓越性能。它能适应任何线条艺术品,生成高质量图像,具有强大的泛化能力和创新的线预处理算法。MistoLine的发布标志着AI在艺术创作和图像处理领域的新进展,为艺术家、设计师和开发者提供了强大工具。

image.png

【AiBase提要:】

⚙️ 广泛适用性: 能处理任何类型的艺术线条输入,包括手绘草图和不同预处理工具生成的线条。

🖼️ 高质量图像输出: 能生成高质量图像,短边大于1024像素。

💡 创新线预处理算法: 开发了名为Anyline的新线预处理算法,增强了模型的处理能力。

详情链接:https://top.aibase.com/tool/mistoline

10、OpenAI探索允许用户 “负责任” 地制作AI生成的色情内容

OpenAI正在重新审视其NSFW政策,探索允许用户负责任地制作AI生成的色情内容。这引发了对开放NSFW政策风险的担忧,尤其是涉及青少年和深度伪造色情的问题。公司表示将讨论是否应永远禁止AI产品的色情文本和裸体图像。

【AiBase提要:】

⚠️ OpenAI探索允许用户制作AI生成的色情内容,引发对NSFW政策风险的担忧。

🔍 OpenAI重新审视NSFW政策,讨论是否应永远禁止AI产品的色情文本和裸体图像。

⚠️ AI生成图像或视频色情内容可能被滥用,带来严重伤害。

11、谷歌DeepMind发布AlphaFold 3 有望加速特效药研发

谷歌DeepMind与Isomorphic Labs联合发布了最新版的AlphaFold3,这是一款能够预测蛋白质、DNA、RNA、配体等结构及其相互作用的大模型。AlphaFold3的发布预示着在新药发现方法与效率上的重大进步,为阻止新冠病毒传播提供了新的希望。AlphaFold3的技术创新将对生物医药领域带来深远影响。

【AiBase提要:】

🧬 AlphaFold3是一款能够预测蛋白质、DNA、RNA、配体等结构及其相互作用的大模型,为新药发现带来重大进步。

🔬 AlphaFold3应用示例之一是预测新冠病毒的刺突蛋白结构,为研发特效药和疫苗提供新思路。

💡 AlphaFold3的技术创新包括扩散模型和Pairformer模块,提高了蛋白质结构预测准确率和架构解读能力。

详情链接:https://www.nature.com/articles/s41586-024-07487-w#citeas

12、微软研发巨大新生成式AI模型,为美国情报机构提供分析机密信息

微软最近研发了一款巨大的新生成式AI模型,旨在为美国情报机构提供分析机密信息的方法,而不会泄露任何内容。这款“空隔离”AI基于OpenAI的GPT-4模型,将提供给1万名用户使用,包括CIA等情报机构。微软首席技术官表示,这是他们首次拥有孤立版本的AI,只有美国政府可以访问。

【AiBase提要:】

⭐ 微软研发了一款巨大的新生成式AI模型,可在无互联网的情况下处理机密数据。

⭐ 为了让美国情报机构能够分析机密信息而不泄露任何内容。

⭐ 这款“空隔离”AI基于OpenAI的GPT-4模型,将提供给1万名用户使用,包括CIA等情报机构。

13、微软发布研究报告:75%的知识工作者在工作中使用AI

本篇文章报道了微软最近发布的研究报告,指出知识工作者在工作中使用人工智能的比例达到了75%,并探讨了人工智能对工作方式的影响和未来发展趋势。报告显示人工智能提升了生产力和效率,但也存在一些风险和挑战。文章还介绍了微软推出的新功能和人工智能在就业市场上的影响。

【AiBase提要:】

🔍 人工智能在工作中的普及率达到75%

💡 人工智能提升了知识工作者的生产力和效率

⚠️ 人工智能的普及也带来了数据安全和风险问题

14、马斯克旗下 xAI 最快本周完成融资 估值将约达 180 亿美元

埃隆・马斯克旗下人工智能初创公司xAI即将完成最新一轮融资,估值飙升至约180亿美元,吸引红杉资本等重量级投资者。这次融资将进一步增强xAI在人工智能领域的竞争力,马斯克表示未来Grok3对AI GPU需求将增长至10万块,与竞争对手展开激烈模型竞争。

【AiBase提要:】

🚀 xAI即将完成最新一轮融资,估值飙升至约180亿美元,吸引红杉资本等重量级投资者。

💡 xAI展示最新研发的多模态模型Grok-1.5Vision,具备处理文本、图像、文档和表格等多种格式内容的能力。

💪 xAI将在人工智能领域进一步增强竞争力,未来Grok3对AI GPU需求将增长至10万块,与竞争对手展开激烈模型竞争。

举报

  • 相关推荐
  • 大家在看
  • ChattyUI:你的私人AI聊天工具,运行在浏览器中。

    Chatty是一个利用WebGPU技术在浏览器中本地且私密地运行大型语言模型(LLMs)的私人AI聊天工具。它提供了丰富的浏览器内AI体验,包括本地数据处理、离线使用、聊天历史管理、支持开源模型、响应式设计、直观UI、Markdown和代码高亮显示、文件聊天、自定义内存支持、导出聊天记录、语音输入支持、重新生成响应以及明暗模式切换等功能。

  • AsyncDiff:异步去噪并行化扩散模型

    AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。这种方法显著减少了推理延迟,同时对生成质量的影响很小。AsyncDiff 支持多种扩散模型,包括 Stable Diffusion 2.1、Stable Diffusion 1.5、Stable Diffusion x4 Upscaler、Stable Diffusion XL 1.0、ControlNet、Stable Video Diffusion 和 AnimateDiff。

  • MacAIverse:macOS风格的开源React桌面环境

    MacAIverse是一个完全由AI生成代码,使用React构建的macOS风格的开源桌面环境。该项目由Claude AI助手初始创建,现在开放给其他Claude实例或其他开发者贡献新的应用。它遵循macOS设计原则,保持与整体桌面环境的一致性,并通过Tailwind CSS和framer-motion库实现流畅的动画和响应式布局。

  • EvTexture:视频超分辨率纹理增强技术

    EvTexture是一种基于事件的视觉驱动的视频超分辨率(VSR)技术,它利用事件信号中的高频细节来更好地恢复VSR中的纹理区域。该技术首次提出使用事件信号进行纹理增强,通过迭代纹理增强模块逐步探索高时间分辨率的事件信息,实现纹理区域的逐步细化,从而获得更准确、丰富的高分辨率细节。在四个数据集上,EvTexture达到了最先进的性能,特别是在Vid4数据集上,与最近的基于事件的方法相比,可以获得高达4.67dB的增益。

  • Telegraf:开源服务器代理,用于收集和报告指标

    Telegraf是一个开源的服务器代理,用于收集和发送来自数据库、系统和IoT传感器的所有指标和事件。它使用Go语言编写,编译成一个单一的二进制文件,无需外部依赖,占用的内存非常小。Telegraf拥有300多个插件,由社区成员编写,覆盖了云服务、应用程序、IoT传感器等多种数据源。它支持灵活的解析和序列化,适用于多种数据格式,如JSON、CSV、Graphite,并能将数据序列化为InfluxDB行协议和Prometheus等。Telegraf还具有稳健的交付保证,包括流量回压、调度器、时钟漂移调整、全流支持等。此外,Telegraf的自定义构建器允许用户选择特定插件包含在Telegraf二进制文件中,适合在资源受限的设备上使用。

  • iA Writer:纯净写作体验,专注流状态

    iA Writer是一款专注于写作的应用程序,旨在提供纯净的写作环境,帮助用户专注于内容创作。它通过简洁的界面设计和强大的功能,如语法检查、文本聚焦等,帮助用户提高写作效率和质量。iA Writer背后的设计理念是利用人工智能技术,让用户在写作时思考得更多,而不是更少,从而提升写作体验。

  • Groqnotes:使用Groq、Whisper和Llama3从音频生成有组织的笔记。

    Groqnotes是一个基于Streamlit的应用程序,它通过迭代解析和生成从转录的音频讲座中提取的笔记来构建结构化的讲座笔记。该应用程序混合使用了Llama3-8b和Llama3-70b模型,利用较大的模型生成笔记结构,较快的模型创建内容。Groqnotes的主要优点包括快速转录音频和生成文本,以及通过策略性地在两种模型之间切换来平衡速度和质量。此外,它还支持Markdown样式,可以在Streamlit应用程序中创建美观的笔记,包括表格和代码,并允许用户下载包含全部笔记内容的文本或PDF文件。

  • june:本地语音聊天机器人,保护隐私,无需联网。

    june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。

  • Meilisearch:极速、高度相关的搜索引擎

    Meilisearch是一个灵活且强大的用户为中心的搜索引擎,可以轻松添加到任何网站或应用程序中。它以其极速的搜索响应(小于50毫秒)和即插即用的特性(智能预设,零配置启动)著称。Meilisearch还提供了先进的全文搜索引擎,具有出色的相关性,适用于各种用例。此外,它是一个开源项目,拥有一个友好且快速增长的社区。

  • nerve:无需编写代码即可创建智能代理的LLM工具。

    Nerve是一个可以创建具有状态的代理的LLM工具,用户无需编写代码即可定义和执行复杂任务。它通过动态更新系统提示和在多个推理过程中保持状态,使代理能够规划和逐步执行完成任务所需的操作。Nerve支持任何通过ollama、groq或OpenAI API可访问的模型,具有高度的灵活性和效率,同时注重内存安全。

  • Tap4 AI Crawler:开源的网页爬虫,支持AI技术目录更新和网站摘要。

    Tap4 AI Crawler 是由 tap4.ai 开源的网页爬虫,能够将网站转换为包含LLM的摘要信息。它具备强大的网页抓取、爬取和数据提取能力,以及网页截图功能。基于Python构建,轻量级,易于维护,适合对AI工具目录感兴趣的个人开发者以及对Python感兴趣的学习者。

  • Local III:本地机器智能的探索之旅

    Local III是一个由超过100名来自世界各地的开发者共同开发的更新,它提供了易于使用的本地模型浏览器,深度集成了推理引擎如Ollama,为开放模型如Llama3、Moondream和Codestral定制了配置文件,并提供了一套设置,使离线代码解释更加可靠。Local III还引入了一个免费的、托管的、可选的模型通过解释器--model i。与i模型的对话将用于训练我们自己的开源计算机控制语言模型。

  • 4M:多模态和多任务模型训练框架

    4M是一个用于训练多模态和多任务模型的框架,能够处理多种视觉任务,并且能够进行多模态条件生成。该模型通过实验分析展示了其在视觉任务上的通用性和可扩展性,为多模态学习在视觉和其他领域的进一步探索奠定了基础。

  • LLM101n:构建一个会讲故事的人工智能大型语言模型。

    LLM101n是一个开源课程,旨在教授如何从头开始构建一个能讲故事的人工智能大型语言模型(LLM)。课程内容涵盖了从基础到高级的多个方面,包括语言模型、机器学习、深度学习框架等,适合希望深入理解AI和LLM的编程人员和研究人员。

  • Ohai.ai:智能家庭助理,简化家务管理

    Ohai是由Care.com创始人Sheila Lirio Marcelo带领的团队创建的智能家庭助理,旨在减轻家庭事务负责人的心理负担。它通过文本消息与用户互动,帮助管理家庭日程、待办事项、协调家庭和看护者之间的沟通,并跟踪学校邮件等。

  • RecruiterCloud:一站式智能招聘与人才搜索工具

    RecruiterCloud是一个为初创公司设计的一站式招聘和人才搜索工具。它专注于速度、效率和易用性,提供智能搜索和人才挖掘功能。该平台拥有超过1100万美国工程师和数据科学家的数据库,通过先进的筛选和自定义高亮功能,帮助用户快速找到合适的候选人。此外,RecruiterCloud还提供一键式外联自动化、与现有ATS无缝同步等特性,简化招聘流程,缩短招聘时间。

  • Playmaker Document AI:自动化文档工作流程,释放AI的力量。

    Playmaker Document AI是一款旨在通过人工智能技术自动化文档处理流程的产品。它通过智能识别和提取文档中的数据,帮助用户消除手动工作,简化基于文档的流程。产品背景信息显示,Playmaker Document AI由Playmaker Software Ltd.开发,团队来自伦敦、爱丁堡、伊斯坦布尔和新德里。产品的主要优点包括数据的安全性、支持多种文档类型、以及能够与300多个集成无缝对接。

  • Spiral:自动化写作和创意任务的智能助手

    Spiral是一个旨在自动化重复写作、思考和创意任务的在线工具。它通过用户的训练示例来学习用户的语音、语调和风格,进而生成符合用户要求的输出内容。Spiral的主要优点包括:快速启动、个性化输出、团队协作以及持续优化。产品背景信息显示,Spiral受到了多位行业人士的好评,他们认为Spiral能显著提高工作效率,并且输出内容自然,不显生硬。Spiral提供订阅服务,价格为1美元试用两周,之后为每月20美元或每年200美元。

  • Future You:未来自我模拟,人生规划助手

    Future You是一个在线模拟工具,旨在帮助用户通过一系列问题和模拟,反思和设想自己未来的生活。用户通过回答关于现在的自己、理想生活、职业规划等问题,与AI生成的未来自我进行互动,从而获得对未来的深刻洞察和规划。

  • Rockset:高效的混合搜索和实时分析数据库

    Rockset是一个为大规模数据提供高效搜索和实时分析的数据库平台。它支持向量、文本、地理空间和JSON数据的索引,能够实现混合搜索架构,并通过流式数据摄入和高QPS工作负载来测量端到端延迟。Rockset的主要优点包括实时索引、毫秒级SQL查询、快速开发新功能、降低计算和存储成本,以及无需ETL、去规范化、管理分片、索引或集群的灵活性。

今日大家都在搜的词: