如烟导航
  • 首页
  • QQ群
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI开源项目

      共 97 篇网址
      排序
      发布更新浏览点赞
      GPT-SoVITS

      GPT-SoVITS

      一个功能强大的开源声音克隆项目,它通过创新的少量样本学习技术,使得用户能够快速训练出高质量的文本到语音模型
      1330
      AI开源项目# AI开源项目
      DiffusionGPT

      DiffusionGPT

      一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。
      1320
      AI开源项目# AI开源项目# 人类反馈优化# 优势数据库
      GOT-OCR2.0

      GOT-OCR2.0

      创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。
      1320
      AI开源项目# AI开源项目# 交互式OCR# 光学字符识别
      StarCoder 2

      StarCoder 2

      一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
      1320
      AI开源项目# AI开源项目# AI编程# 代码理解
      FunAudioLLM

      FunAudioLLM

      由阿里巴巴集团通义语音团队开发的框架,旨在增强人类与大型语言模型(LLMs)之间的自然语音交互
      1320
      AI开源项目# AI开源项目
      Animate Anyone

      Animate Anyone

      一个功能强大且易于使用的图像到视频角色动画合成框架。它通过实时动画合成技术和用户友好的界面,使得动画制作变得更加简单和快捷。
      1310
      AI开源项目# AI开源项目# AI技术# 交互体验
      Outfit Anyone

      Outfit Anyone

      一个创新的AI服装虚拟试穿工具,它通过智能技术为用户和模特提供了一种全新的服装试穿体验。无论是消费者、设计师、模特还是电商从业者,都可以利用这个工具来探索和展示服装,为...
      1310
      AI开源项目# AI开源项目# AI试衣间# 个性化推荐
      Draw an Audio

      Draw an Audio

      创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。
      1310
      AI开源项目# AI开源项目# 人工智能# 声音设计
      ScreenAgent

      ScreenAgent

      一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
      1310
      AI开源项目# AI开源项目# ScreenAgent# VLM
      WiseFlow

      WiseFlow

      WiseFlow作为一个开源的AI信息挖掘工具,通过其强大的自动抓取、分类整理和智能处理功能,为用户提供了高效的信息管理解决方案
      1310
      AI开源项目# AI开源项目
      ChatMusician

      ChatMusician

      通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
      1300
      AI开源项目# AI开源项目# 和弦生成# 多模态交互
      Lepton Search

      Lepton Search

      一个功能强大、易于使用的对话式AI搜索引擎,它提供了一个开源的平台,允许用户构建和运行自定义的搜索和AI应用。通过集成大语言模型和搜索引擎,Lepton Search能够提供快速准确的...
      1290
      AI开源项目# AI开源项目# 大语言模型# 对话式AI
      EMO

      EMO

      EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为...
      1290
      AI开源项目# AI开源项目# AI视频生成# 动态帧过渡
      SUPIR

      SUPIR

      一款功能强大且多用途的图像恢复工具,它通过结合AI技术和文本驱动的智能恢复,能够为用户提供高保真度的图像恢复服务
      1290
      AI开源项目# AI开源项目
      OmniParser

      OmniParser

      一个创新的屏幕解析工具,它通过与先进的视觉语言模型结合,显著提升了智能代理在用户界面中的操作能力
      1290
      AI开源项目# AI开源项目
      Unique3D

      Unique3D

      个创新的单图像 3D 网格生成工具,以其高保真度、高效训练和优化以及强泛化能力脱颖而出
      1290
      AI开源项目# AI开源项目
      PhotoMaker V2

      PhotoMaker V2

      一个功能强大、操作简便的 AI 图像生成工具,它通过深度学习技术实现了快速、高质量的逼真人物图像生成。该工具不仅在技术上实现了突破,还在应用场景上展现了广泛的潜力,无论是...
      1280
      AI开源项目# AI图像生成# AI开源项目# GANs技术
      DiT

      DiT

      创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。
      1280
      AI开源项目# AI开源项目# Transformer架构# 上下文条件
      ConsiStory

      ConsiStory

      它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
      1280
      AI开源项目# AI开源项目
      CosyVoice2.0

      CosyVoice2.0

      先进的语音合成模型,通过其低延迟、高准确性和强稳定性的特点,为用户提供高质量的语音合成体验
      1280
      AI开源项目# AI开源项目
      MagicVideo-V2

      MagicVideo-V2

      一个创新的AI视频生成框架,它通过集成多个模块来生成高质量的视频内容。它不仅提高了视频生成的效率和质量,还确保了视频画面的流畅和逼真,为用户提供了极佳的观看体验。
      1270
      AI开源项目# AI开源项目# AI视频生成# 多阶段生成
      EMO

      EMO

      一个创新的音频驱动肖像视频生成工具,凭借其简单的输入方式、丰富的表情生成能力、多语言支持以及对多种肖像风格的兼容性
      1270
      AI开源项目# AI开源项目
      GameNGen

      GameNGen

      由谷歌推出的世界首个完全由AI驱动的游戏引擎,旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面,无需手动编写代码
      1270
      AI开源项目# AI开源项目
      VideoDoodles

      VideoDoodles

      一个极具创意和实用性的工具,它将手绘艺术与视频编辑相结合,为视频创作者提供了一种全新的表达方式
      1270
      AI开源项目# AI开源项目
      Gummy

      Gummy

      创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高...
      1260
      AI开源项目# AI开源项目
      Make-A-Character

      Make-A-Character

      创新的3D角色生成框架,它通过文本描述快速创建逼真的3D角色,具有高度的定制性和逼真度。它结合了最新的人工智能技术,提供了一个直观、灵活且高效的角色创建解决方案,适用于多...
      1260
      AI开源项目# 3D建模# AI开源项目# CG技术
      Depth Anything

      Depth Anything

      强大的单目深度估计工具,它通过利用大规模未标注数据和先进的数据增强技术,实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。
      1260
      AI开源项目# 3D建模# AI开源项目# AR/VR融合
      HivisionIDPhotos

      HivisionIDPhotos

      HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求,还提供了人像抠图、底色添加、排版照生成等高级功能
      1260
      AI开源项目# AI开源项目
      RMBG-2.0

      RMBG-2.0

      由BRIA AI推出的一款下一代图像背景移除模型,它基于创新的BiRefNet架构,能够在复杂环境中提供高精度的背景移除结果
      1260
      AI开源项目# AI开源项目
      DreaMoving

      DreaMoving

      一个强大的视频生成框架,通过其创新的Video ControlNet和Content Guider,实现了对视频内容的高度控制
      1260
      AI开源项目# AI开源项目
      加载更多
      Copyright © 2025 如烟导航 

       豫ICP备2024076496号

       
      ×
      收藏本站!
      希望您能通过知乎、公众号、简书、豆瓣、抖音、微博、微信、个人网站等媒介告诉身边朋友进站必读

      • 如烟笔记如烟笔记
      • 花瓣花瓣
      • 可画设计可画设计
      • 喜马拉雅喜马拉雅
      • 小红书小红书
      • 抖音抖音

      • 添加应用添加应用
      • 关闭折叠dock栏
      • 网站提交网站提交
      ×

      添加应用

      添加后右键点击即可删除







      确定删除该应用吗?

      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍