11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
AgentHospital是一个创新的虚拟AI医院平台,它通过模拟医院中的所有真实医疗流程,为医疗教育和临床决策提供了一个高效的训练和研究环境。该平台涵盖了从疾病发生到治疗与康复的整个医疗过程,包括分诊、挂号、咨询、检查、诊断、治疗和随访等关键环节。这一结果证明了AgentHospital在提高医疗诊断准确性方面的潜力。
在AI技术不断创新的今天,HeyGen公司最近推出了一款名为InstantHighlights1.0的自动视频剪辑工具,旨在为用户提供更便捷的视频编辑体验。通过这个工具,用户可以上传视频或粘贴视频链接,并选择所需的语言,InstantHighlights1.0将自动将视频剪辑成不同语言配音的短片。随着AI技术的不断发展,我们有理由相信,HeyGen将继续引领虚拟角色和视频编辑技术的潮流,为用户带来更加丰富
【新智元导读】为了搞钱,微软、OpenAI、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来!大模型发展至今早已火成了一个「概念」。这种结构允许直观地将复杂的行为拼凑在一起,从增强了用户可访问性和系统灵活性。
4月23日,极星品牌之夜盛大举行,备受瞩目的极星手机PolestarPhone正式亮相。这款手机以“车手互联生态的AI旗舰手机”为定位,独特地提供了16GBRAM与1TB存储空间的组合版本,定价为7388元。PolestarPhone的发布,不仅展示了极星在智能手机领域的创新实力,也预示着车手互联生态的未来发展将更加紧密与多元。
Heygen近期发布了其AvatarinMotion1.0新功能,这一技术革新在虚拟角色动作捕捉和声音克隆方面取得了重大突破。该功能可以精确地保持口型同步,并克隆用户的语音语调,甚至能保留背景声,使得虚拟角色的语音表达更为生动真实。所以,如果她在海边卖贝壳、那她肯定是卖海边贝壳的。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AgentsLAVE是Meta发布的全新AI自动剪辑视频工具,采用AI技术实现简单短视频和广告视频的自动生成,无需人工干预。工具界面包括输入提示、素材库和视频时间轴Agents设计则指导编辑行动计划的执行。AgentsLAVE的发布将为视频编辑带来革命性变化,实现更高效、智能的视频剪辑流程。
1月27日,由中关村论坛办公室、北京市网信办、北京市发改委、北京市经信局、海淀区人民政府指导,中关村科学城管委会、CSDN中国开发者网络联合主办的“中关村开源生态论坛暨大模型智能应用技术大会”在刚建成的中关村论坛永久会址成功举办。大会由全体大会以及大模型技术与开源生态发展、智能应用开发与创新、AIGC时代的技术创作三大专题论坛组成,并颁发了大模型生态领军企业、AIGCTop智能应用两项重要奖项。宋丽在会议现场表示,未来数势将不断完善优化SwiftAgent设计,为开发者和企业用户提供核心技术过硬、实施可落地、符合先进行业业务期待的大模型智能应用产品!关注【数势科技】,了解更多产品能力并申请试用。
面壁智能联合清华大学自然语言处理实验室发布了GitAgent,这是一种可以自主扩展工具箱的大模型智能体应用框架。通过GitAgent,大模型智能体可以从GitHub上扩展工具集合,以应对复杂任务需求。这一研究成果有望推动大模型智能体技术的发展,帮助人类实现更加多样更加复杂的任务需求。
ReactAgent是一个基于GPT-4语言模型的实验性自动化代理,专门用于生成和组合React组件。它使用React、TailwindCSS、Typescript、RadixUI、ShandcnUI和OpenAIAPI构建,遵循原子设计原则以提高代码质量。要获取更多详细信息并开始您的自动化React代码生成之旅,请访问ReactAgent官方网站。
腾讯推出的M2UGen是一款多模态音乐生成框架,结合音乐和多模态任务,支持从文字、图像、视频生成音乐,并具备强大的编辑功能。体验地址:https://top.aibase.com/tool/m2ugen米老鼠SD模型上线迪士尼旧版米老鼠版权过期,AI开发者推出基于Stable-Diffusion-xl的Mickey-1928SD模型,用于生成符合1928年设计风格的米老鼠、米妮和皮特的图像。模型下载地址:https://huggingface.co/damo-vilab/dreamtalk项目地
12月28日,为期两天的顶级技术盛会Qcon全球软件开发大会暨十五周年大会在上海顺利开幕。本次大会以“启航·AIGC软件工程变革”为主题,策划了LLM时代的性能优化、加速声称是AI落地的最佳实践、GenAI和通用大模型应用探索等20余个演讲专题。数势秉承开放的生态合作态度,联合智谱AI、百川智能合作,以能力耦合、协同上市、持续迭代的方式为客户提供开箱即用的大模型一体化解决方案,共同应对大模型在研发周期长、部署门槛高、上线成本高、业务安全性方面的挑战。
摘要:数势科技正式推出融合大模型能力的自动化业务分析产品:数势智能分析助手——SwiftAgent,帮助企业实现基于自然语言和行业认知的业务数据洞察和分析,真正完成数据指标化、指标价值化的有效转化,开启企业数字化经营分析新时代!2023年是大模型爆发的一年,走在大模型探索前列的头部企业纷纷探索它在数字化建设方面的落地场景。如需进一步交流/申请产品试用请关注“数势科技”官网。
OpenAICEOSamAltman在Reddit上辟谣称公司未计划发布GPT-4.5,否认最新语言模型的泄露,截图显示为虚假信息。OpenAI新研究:GPT-2能监督GPT-4研究发现通过以GPT-2级模型为弱监督者对GPT-4进行微调,能显著提高自然语言处理任务中的泛化性能,为超级AI对齐问题提供新思路。代码地址:https://github.com/Coframe/coffee谷歌发布NeRFiller,用2D图像补全3D场景谷歌与加州大学伯克利分校的研究人员合作推
随着扩散模型的飞速发展,诞生了Midjourney、DALL·E3、StableDifusion等一大批出色的文生图模型。但在文生视频领域却进步缓慢,因为文生视频多数采用逐帧生成的方式,这类自回归方法运算效率低下、成本高。语义一致性超过86%,质量一致性超过91%,明显优于Gen-2、PikaLabs、Make-AVideo等知名商业模型。
阿里云开源了通义千问Qwen-72B、Qwen-1.8B以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summaryDeepMind发布自监督扩散模型SODAGoogleDeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。基于大学水平考试的多模�
用了短短两个星期的时间,星标量从390狂增到10K,并在Discord上吸引了5000多名成员,如此爆火的项目便是微软最近发布的全新工具AutoGen。我们可以将AutoGen理解为一个框架,其允许多个LLM智能体通过聊天来解决任务。还没体验的小伙伴,根据官方提供的安装步骤,可以上手一试了。
Meta公司发布了Quest3头显,售价为499.99美元起。Quest3是全球首台搭载全新高通骁龙XR2Gen2芯片的设备。Quest3也升级了空间音频,现在用户可以体验到比Quest2大40%的音域,在音频清晰度和低音表现上都有改进。
Meta计划推出名为「GenAIPersonas」的AI聊天机器人服务,旨在挽回社交媒体平台的用户流失问题。这款AI聊天机器人将具备个人助理功能,不同性格的聊天机器人选择以及帮助用户更好表达自己的能力。虽然Meta希望通过这一产品吸引年轻用户,但目前的反应复杂,不确定性较大。
Meta和CMU联合研究团队耗时两年,成功开发出了一款名为RoboAgent的通用机器人智能体。RoboAgent仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,包括烘焙、拾取物品、上茶、清洁厨房等任务,并能在100种未知场景中泛化应用。这项研究对于推动通用机器人智能体的发展具有重要意义。
DreamGenerator是一款AI相机,它结合了生成式AI和微调技术,可以将拍摄的图像转换为新的主题,同时保留原始照片的基本元素。相机预设了30个主题,用户可以选择拍摄不同的世界,如天堂、地狱、中世纪、水下或外太空等。对于想要获得这种人工智能相机的人来说,可能需要自己构建它或将其构建为智能手机的应用程序。
三星计划在7月26日举行产品发布会,发布全新的GalaxyZFold系列折叠屏手机以及GalaxyTabS9系列平板电脑。GalaxyTabS9系列将包括GalaxyTabS9、GalaxyTabS9Plus和GalaxyTabS9Ultra三款不同型号。更多详细信息将在7月26日的发布会上揭晓。
三星将在7月26日发布GalaxyZFold系列折叠屏手机,同时还会推出新款平板电脑GalaxyTabS9系列。GalaxyTabS9系列包含三款:GalaxyTabS9、GalaxyTabS9和GalaxyTabS9Ultra。三星GalaxyTabS9系列是一款配置强劲、价格高昂的安卓板皇,预计将吸引高端用户和追求性能的用户。
随着对AI工具的需求增加,对能够完成更多任务的系统的需求也越来越大。企业可以通过拥有像ChatGPT或Bard这样的聊天界面来受益,这些界面能够对冗长的文件进行摘要或筛选客户数据以获取见解。这是由于模型无法处理较长的上下文长度,导致混淆和产生幻觉。
Meta的MusicGen可以根据文本提示生成短小的新音乐片段,并可选择与现有旋律对齐。与今天的大多数语言模型一样,MusicGen基于Transformer模型。在Huggingface上提供了演示。
三星将要推出新一代高端平板电脑Galaxy+Tab+S9系列,预计在今年下半年登场。三星Galaxy+Tab+S9+Ultra已经现身Geekbench6跑分网站,单核2054分,多核5426分,性能释放十分优秀。Galaxy+Tab系列平板的主要竞争对手为Apple的iPad系列,除了防护等级的提升,新款平板将会有更多针对高端平板制订的市场策略,后续可能会有更多的细节泄露出来。
机器人学习技术能够概括广泛的任务、设置和对象。这些策略需要广泛、多样化的数据集在实际的机器人环境中获取这些数据集既困难又昂贵。研究人员认为,研究语言和视觉语言模型的混合是否或是否可以提供出色的场景生成器,这将是一种引人入胜的未来方法。
世界色彩研究机构潘通正式发布了2023年度流行色—— Viva Magenta 洋红色。根据潘通的说法,这种颜色是自然的红色,充满活力,是一种新的力量信号。值得一提的是,小米CEO雷军和小米产品经理魏思琪也发文介绍了洋红色描述、灵感来源,或许会在小米13系列中运用这一配色。
今天,高通正式宣布推出全新的旗舰XR平台:骁龙XR2+ Gen 1,Meta的VR头显新品Quest Pro宣布首发使用该芯片...根据高通官网介绍,新的XR2+平台能够实现50%的续航表现提升,以及30%的散热性能提升...另一方面,XR2+引入了新的图像处理管线,能够实现低于10毫秒的超低时延;凭借这一特性,该平台支持并行感知技术,包括头部、手势和手柄追踪、3D 重建以及低时延视频透视...除了已经发布的Meta Quest Pro外,还有多个厂商宣布将推出搭载XR2+ Gen 1的产品......
业内领先的数据处理和互连 IC 设计公司 Montage Technology,刚刚推出了面向顶级 DRAM 内存供应商的首款 Gen1 DDR5 时钟驱动器(CDK / DDR5CK01)样品。此举旨在帮助合作伙伴开发用于新一代台式机和笔记本电脑的 DDR5 内存模块,但此前多年, CDK 一直被集成到寄存器(RCD)设备中,并且主要面向服务器平台、而不是消费级 PC 市场。随着 DDR5 数据速率的大幅提升,时钟信号的频率也越来越高。与之一同到来的,还有日渐具有挑战性的时钟信号完整性问题。在 DDR5 速率达到 6400 MT/s 及以上后,这一问题会变得愈加凸显。无论是台式机、还是?