如烟导航
  • 首页
  • QQ群
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI开源项目

      共 97 篇网址
      排序
      发布更新浏览点赞
      Swarm

      Swarm

      Swarm是一个由OpenAI解决方案团队管理的教育框架,旨在探索轻量级、易于使用的多智能体编排技术。
      1830
      AI开源项目# AI开源项目
      AtomoVideo

      AtomoVideo

      一个创新的图像到视频生成框架,它通过先进的技术和灵活的架构,为用户提供了一种从静态图像生成高保真视频的新方法
      1820
      AI开源项目# AI开源项目
      Fluid

      Fluid

      一个创新的文本到图像生成模型,通过使用连续标记和随机生成顺序,显著提高了图像生成的质量和性能
      1820
      AI开源项目# AI开源项目
      TextDiffuser-2

      TextDiffuser-2

      一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。
      1810
      AI开源项目# AI图像生成# AI开源项目# 内容创造
      DreaMoving

      DreaMoving

      一个强大的视频生成框架,通过其创新的Video ControlNet和Content Guider,实现了对视频内容的高度控制
      1810
      AI开源项目# AI开源项目
      NotebookLlama

      NotebookLlama

      Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成
      1800
      AI开源项目# AI开源项目
      DeepTranslate

      DeepTranslate

      一款功能强大、使用便捷的免费AI双语页面翻译浏览器插件。它支持多种语言和翻译API,能够满足用户在不同场景下的翻译需求
      1800
      AI开源项目# AI开源项目# AI浏览器插件
      Ovis1.6

      Ovis1.6

      强大的多模态大模型,它通过创新的架构设计和全面的数据优化,在多模态任务上展现了卓越的性能。
      1790
      AI开源项目# AI开源项目
      Motionshop

      Motionshop

      一个强大的工具,能够快速将视频中的人物替换为3D虚拟形象,同时保持视频的自然感和连贯性
      1790
      AI开源项目# AI开源项目
      ScreenAgent

      ScreenAgent

      一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
      1780
      AI开源项目# AI开源项目# ScreenAgent# VLM
      CosyVoice2.0

      CosyVoice2.0

      先进的语音合成模型,通过其低延迟、高准确性和强稳定性的特点,为用户提供高质量的语音合成体验
      1780
      AI开源项目# AI开源项目
      EMO

      EMO

      EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为...
      1760
      AI开源项目# AI开源项目# AI视频生成# 动态帧过渡
      DiffusionGPT

      DiffusionGPT

      一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。
      1750
      AI开源项目# AI开源项目# 人类反馈优化# 优势数据库
      GameNGen

      GameNGen

      由谷歌推出的世界首个完全由AI驱动的游戏引擎,旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面,无需手动编写代码
      1740
      AI开源项目# AI开源项目
      Gummy

      Gummy

      创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高...
      1730
      AI开源项目# AI开源项目
      Real-ESRGAN

      Real-ESRGAN

      一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。
      1720
      AI开源项目# AI开源项目# GAN技术# U-Net判别器
      HivisionIDPhotos

      HivisionIDPhotos

      HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求,还提供了人像抠图、底色添加、排版照生成等高级功能
      1720
      AI开源项目# AI开源项目
      FaceChain

      FaceChain

      它通过结合Stable Diffusion模型和LoRA风格化模型,为用户提供了一个简单易用的平台来生成个性化的数字形象和写真。无论是用于个人娱乐还是专业需求,FaceChain都能满足用户的多样...
      1710
      AI开源项目# AI图像生成# AI开源项目# 个性化定制
      Llama 3.2

      Llama 3.2

      在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性。
      1710
      AI开源项目# AI大模型# AI开源项目# 图像理解
      MaskGCT

      MaskGCT

      一个功能强大的语音合成大模型,它不仅在技术上达到了行业领先水平,还在多语言支持、声音克隆和语音控制等方面表现出色
      1700
      AI开源项目# AI开源项目
      ConsiStory

      ConsiStory

      它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
      1690
      AI开源项目# AI开源项目
      UniEdit

      UniEdit

      UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。
      1690
      AI开源项目# AI开源项目# 文本驱动编辑# 无需调优
      abab-music-1

      abab-music-1

      一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。
      1680
      AI开源项目# AI开源项目# AI音乐生成# 业余音乐制作
      Tailor

      Tailor

      一款集视频剪辑、生成和优化功能于一身的智能视频处理工具,凭借其简单易用的操作方式、强大的功能和智能高效的处理能力
      1680
      AI开源项目# AI开源项目
      ActAnywhere

      ActAnywhere

      一个强大的视频生成工具,它通过自动化的前景与背景融合技术,极大地简化了视频背景生成的过程。它的应用场景广泛,从电影制作到教育,都能提供高效、创新的解决方案。
      1650
      AI开源项目# AI开源项目# 交互式视频编辑# 人工智能
      Roop

      Roop

      一个功能强大的换脸工具,以其简单易用和高性能的特点,为用户提供了一种便捷的方式来实现视频中的面孔替换
      1630
      AI开源项目# AI开源项目
      Seed-VC

      Seed-VC

      一个创新的声音转换工具,它通过零样本学习技术,能够在不需要特定目标音色样本的情况下实现高质量的声音转换
      1630
      AI开源项目# AI开源项目
      EasyAnimate

      EasyAnimate

      基于Transformer架构的视频生成工具,提供了高效、灵活的视频生成解决方案
      1630
      AI开源项目# AI开源项目
      STranslate

      STranslate

      一款实用的翻译和OCR工具,以其即用即走的特点、开源免费的优势以及社区支持的便利性,为用户提供了高效、便捷的文本处理解决方案
      1610
      AI开源项目# AI开源项目
      MMMLU

      MMMLU

      重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
      1600
      AI开源项目# AI开源项目# AI模型评估# 国际化业务
      加载更多
      Copyright © 2026 如烟导航 

       豫ICP备2024076496号

       
      ×
      收藏本站!
      希望您能通过知乎、公众号、简书、豆瓣、抖音、微博、微信、个人网站等媒介告诉身边朋友进站必读

      • 如烟笔记如烟笔记
      • 花瓣花瓣
      • 可画设计可画设计
      • 喜马拉雅喜马拉雅
      • 小红书小红书
      • 抖音抖音

      • 添加应用添加应用
      • 关闭折叠dock栏
      • 网站提交网站提交
      ×

      添加应用

      添加后右键点击即可删除







      确定删除该应用吗?

      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍