首页 > 业界 > 关键词  > CogView3最新资讯  > 正文

AI日报:智谱开源图像生成模型CogView3;AI声音克隆差点骗走律师父亲3万美金;GGHead​颠覆3D建模

2024-09-30 14:24 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、文生图卷起来了!智谱开源图像生成模型CogView3生成速度比SDXL快10倍!

智谱AI最新开源的CogView3和CogView-3Plus-3B为文生图领域注入新活力,CogView3采用独特的级联扩散方法,生成质量超越SDXL,且推理速度快10倍。CogView-3Plus-3B基于DiT框架,优化了Zero-SNR扩散噪声调度和联合文本-图像注意力机制,支持广泛的图像分辨率范围。智谱AI提供建议和工具帮助用户优化提示词,降低使用门槛。

image.png

【AiBase提要:】

🚀 CogView3采用级联扩散方法,生成质量超越SDXL,推理速度快10倍。

💡 CogView-3Plus-3B基于DiT框架,引入Zero-SNR扩散噪声调度和联合文本-图像注意力机制。

🔧 智谱AI提供建议和示例脚本,帮助用户优化提示词,降低使用门槛。

详情链接:https://github.com/THUDM/CogView3

2、AI声音克隆诈骗升级!一通电话差点骗走律师父亲3万美金

最近爆发的AI声音克隆诈骗案件引发了广泛关注,凸显了这项技术可能带来的巨大风险。事件揭示了人类在面对高度逼真的AI声音克隆时的脆弱性,呼吁加强对AI行业的监管以保护消费者免受侵害。文章还提到了声音克隆技术的潜在风险和积极用途,以及应对高科技诈骗的建议。

【AiBase提要:】

🚨 高科技诈骗:AI声音克隆技术引发警示,骗子利用AI模仿声音进行诈骗,成功率惊人。

💡 安全挑战:人类在识别AI生成声音时存在高错误率,紧迫需要开发深度伪造检测工具。

⚠️ 风险警示:新型攻击手法音频劫持结合多种AI技术,可能导致资金被转移到虚假账户。

3、颠覆3D建模!GGHead:实现超高速高质量、角色一致3D头部生成

GGHead是一种新颖的3D建模技术,由慕尼黑工业大学的Tobias Kirschstein等人研发。它能在超快速度下生成高质量、视角一致的3D人头模型,降低了3D建模门槛,为未来的人类建模研究开辟新可能性。

image.png

【AiBase提要:】

🌟 使用普通GPU实时生成高分辨率的3D人头模型

💡 利用3D高斯点云表示和2D CNN生成高斯属性,提高建模效率

🔧 引入“全变差损失”技术提升几何精度,保证图像质量和一致性

详情链接:https://tobias-kirschstein.github.io/gghead/

4、全新视觉识别技术Revisit Anything

这篇文章介绍了一种创新的视觉位置识别技术Revisit Anything,通过输入图片即可识别出图片中的地点。该技术结合了SAM和DINO技术,提升了图像段的检索效果,实现更精确的地点重识别。研究团队使用了多个数据集进行测试,建议用户从17places数据集开始,快速上手。通过特征提取、聚类中心生成和SegVLAD管道运行,用户可以获取高效的识别结果。这项研究推动了视觉位置识别领域的发展。

【AiBase提要:】

🌟 结合SAM和DINO技术,推出新颖的视觉位置识别方法。

📊 用户可快速上手并运行实验,通过详细的步骤和脚本获取高效结果。

🔍 提供了一种新的视觉位置识别方案,利用现代深度学习模型进行图像分析,推动了该领域的发展。

详情链接:https://github.com/AnyLoc/Revisit-Anything

5、海信发布AI电视E7N,内置AI芯片

海信发布的E7N超画质Mini LED电视搭载了海信自主研发的Mini LED控光芯片,亮度高达4000nits,背光调控精细,画面清晰明暗分明。内置信芯AI芯片通过深度学习优化画质,观看体验极佳。性能强劲,支持4路HDMI2.1接口,适合游戏玩家使用。

image.png

【AiBase提要:】

🌟 E7N搭载海信自主研发的Mini LED控光芯片,每个芯片可控制8个灯珠,达4224个分区,亮度高达4000nits。

🤖 内置海信首款国产高端画质芯片信芯AI芯片,通过深度学习优化色彩、对比度和清晰度,观看各种节目画质达会员级别。

🎮 E7N首次搭载MT9655SOC芯片,性能提升164%和219%,支持4路HDMI2.1接口,游戏体验全面提升。

6、自称开源版Cursor 刚融资350万的PearAI被指抄袭

PearAI作为自称开源版Cursor的AI编程工具,最近获得YCombinator50万美元融资,引发了关于创新、借鉴与商业化的争论。创始人Pan声称产品性能超越C0pilot,但被指抄袭其他开源项目。争议暴露了开源世界中创新与借鉴的界限问题,以及科技创业中夸大项目独特性可能带来的负面影响。

【AiBase提要:】

🔍 PearAI获YCombinator融资,引发创新、借鉴与商业化争论

💡 Pan声称产品性能超越C0pilot,但被指抄袭其他开源项目

🌐 开源社区面临如何保持创新、展示项目价值的挑战

详情链接:https://x.com/CodeFryingPan/status/1840464744626675719

7、加州AI监管法案遭否决:纽瑟姆称初衷良好但方法不当

加州州长纽瑟姆否决了备受瞩目的SB1047法案,引发了科技界和政界的广泛讨论。纽瑟姆认为该法案虽初衷良好,但未考虑AI系统具体应用环境及风险程度,不是最佳保护公众方法。这一决定凸显了AI监管的复杂性,挑战在促进创新与确保安全之间寻求平衡。

【AiBase提要:】

🔍 SB1047法案旨在规范大型人工智能模型的开发,要求公司实施安全协议,但遭到硅谷多方反对。

🚫 纽瑟姆否决法案,认为未考虑AI系统具体应用环境及风险程度,不是最佳保护公众方法。

⚖️ 纽瑟姆强调已签署17项AI相关法案,并邀请专家协助制定可行的AI监管措施,凸显了AI监管的复杂性。

8、科幻杂志遭遇AI作品泛滥冲击

在近年来人工智能技术迅猛发展的背景下,在线科幻与幻想杂志《Clarkesworld》遭遇到前所未有的挑战。编辑们感到无奈与沮丧,创作环境恶化,但志愿者帮助建立垃圾邮件过滤器仅是临时措施,长期解决方案仍需探索。

【AiBase提要:】

🌊编辑们感到沮丧,杂志创始人关闭投稿通道是无奈之举

🛑AI泛滥令创作环境恶化,志愿者帮助建立垃圾邮件过滤器

🔧长期解决方案仍需探索,科幻杂志面临AI作品泛滥的生存威胁

9、告别繁琐!ScreenPipe让你的屏幕“自动”工作24小时无休!

厌倦了无休止的会议记录和不同软件间的切换?开源AI屏幕录制工具ScreenPipe能解决你的烦恼。它不仅可以24小时不间断记录屏幕活动和音频,还能自动完成工作任务,节省时间精力。

【AiBase提要:】

⏰24小时不间断录制:完整记录屏幕活动和音频数据。

🤖 智能辅助服务:自动更新笔记、生成报告、填充数据等。

🔍 即时内容概览:快速提取关键信息,节省时间,抓住重点。

详情链接:https://github.com/mediar-ai/screenpipe

10、智谱AI国庆大促:1折调用+1亿免费tokens

智谱AI和清言科技分别推出国庆特别活动和全新大会员体系,为用户提供更多实惠和选择。智谱AI开放平台bigmodel.cn推出1折调用AI模型和1亿tokens免费额度,降低企业和开发者使用高级AI服务成本。清言科技推出大会员体系,19元/月享受多项权益,让更广泛用户群体负担得起高级AI功能。

image.png

【AiBase提要:】

🎉 智谱AI国庆大促,1折调用AI模型,降低企业和开发者成本。

💰 活动赠送1亿tokens免费额度,让更多人体验先进AI技术。

🚀 清言科技推出19元起大会员体系,让更广泛用户群体享受高级AI功能。

举报

  • 相关推荐
  • OPPO ColorOS 16正式版11月升级机型公布:支持23款机型

    ColorOS 16正式版11月升级计划公布,涵盖OPPO Find X7/N3系列、一加Ace 5系列等23款机型。系统引入极光引擎、潮汐引擎及自研繁星编译器,显著提升流畅度并降低功耗。新增一键闪记功能,支持复杂图文与超长视频录制。生态互联实现突破,全面打通Apple Watch生态,支持打车、外卖等信息跨设备显示。通过软硬协同优化,为用户打造更流畅持久的操作体验。

  • 佳能R50V双十一钜惠:漫展COS/汉服Vlog/直播带货一机搞定!

    佳能R50V微单相机以6000元内惊喜价格亮相双十一,配备全像素双核CMOS与智能对焦系统,支持人物/动物/车辆追踪。轻巧机身仅323克,优化握持设计便于外拍。具备6K超采4K录制、14种滤镜及美肤模式,竖拍界面完美适配短视频平台。USB直连实现4K60P直播供电,特写模式自动切换焦点,适合带货与教学。多档套餐覆盖从三脚架到专业滤镜,满足动漫COS、国风Vlog等多场景创作需求,是降低门槛提升品质的优选工具。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 创业者“奥斯卡”!卓世科技荣膺 HICOOL2025全球创业大赛二等奖

    10月16日,HICOOL2025全球创业者峰会在京开幕。卓世科技的“璇玑玉衡大模型+MaaS训练平台+零代码Agent平台”三位一体AI全栈方案,从全球万余项目中脱颖而出,荣获大赛二等奖。该方案在模型性能、易用性及商业化闭环方面展现世界级水准,为大模型产业化落地提供标杆路径。五年来,HICOOL累计吸引167国3.4万项目参赛,孵化16家独角兽,赛后融资总额超500亿元,已成为全球最具影响力的创业赛事之一。

  • OPPO ColorOS 16正式版推送:首批适配11款机型

    ColorOS 16正式版于10月30日启动推送,首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术,实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”,确保全场景丝滑交互;潮汐引擎首发芯片级动态追帧技术,系统重载流畅度提升37%,功耗降低13%;繁星编译器首创安卓跨级融合编译技术,大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力,为用户带来更出色的使用体验。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • Uber与Checkout.com官宣战略合作伙伴关系,为全球企业平台提供高速可靠支付服务

    英国数字支付服务商Checkout.com与出行平台Uber达成全球战略合作,将为Uber在全球主要市场的网约车及外卖平台提供收单和网关服务。凭借其全球覆盖能力与本地化专长,Checkout.com将助力Uber每日处理数百万笔交易,并通过AI技术优化支付流程,提升交易成功率与安全性。此次合作将强化Uber的全球支付体验,支持其数字出行领域的持续创新。

  • PCEVA深度评测:忆联AE531 QLC SSD以高效稳定,从容应对多元应用场景挑战

    PCEVA对忆联首款QLC商用消费级SSD AE531进行深度评测。该产品在性能测试中全面超越同级,顺序读写达6817/5680MB/s,SLC缓存策略提供约110GB空间,60℃满载无降速。跨平台兼容性与低TCO设计满足企业降本增效需求,验证了QLC在商用场景下的稳定优势。

  • 千元卧室投影推荐:实测大眼橙C3D画质/性能/体验都能打

    大眼橙C3D投影仪专为卧室场景设计,小巧机身节省空间,支持自动对焦和梯形校正,操作便捷。配备一体化云台,可360°旋转调节角度,轻松适配不同观影姿势。画质表现优秀,1080P分辨率兼容4K解码,850CVIA亮度确保开灯环境下画面清晰,MEMC运动补偿避免拖影。内置低噪音设计和卧室模式,兼顾安静与舒适观影体验,结合腾讯视频AI语音助手,实现智能操控。整体精准契合卧室娱乐需求,提升幸福感。

  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

今日大家都在搜的词: