hub

CodeZen

CodeZen

一个专注中文区的 GitHub 项目发现

avatar

VITA

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction 📖 VITA-1.5 Paperhttps://arxiv.org/pdf/2501.01957 🤖 Basic Demohttps://modelscope.cn/studios/modelscope/VITA1.5_demo 🍎 VITA-1.0https://vita-home.github.io/ 💬 WeChat 微信./asset/wechat-group.jpg --- 📽 VITA-1.5 De

large-multimodal-models multimodal-large-language-models omni-language-model omni-modal-video-understanding omni-model
star2.4k
Python
avatar

llm_related

复现大模型相关算法及一些学习记录

star2.5k
Python
avatar

D-FINE

English | 简体中文README_cn.md | 日本語README_ja.md | English Blogsrc/zoo/dfine/blog.md | 中文博客src/zoo/dfine/blog_cn.md D-FINE: Redefine Regression Task of DETRs as Fine&8209;grained Distribution Refinement

d-fine detr object-detection
star2.8k
Python
avatar

LiYing

LiYing is an automated photo processing program designed for automating the post-processing workflow of ID photos in general photo studios. | LiYing 是一套适用于自动化 完成一般照相馆后期证件照处理流程的照片自动处理的程序。

background-replacement image-compression image-cropping photo-layout photo-processing
star3.0k
Python
avatar

NarratoAI

利用AI大模型,一键解说并剪辑视频; Using AI models to automatically provide commentary and edit videos with a single click.

aiagent aiops gemini-api llm moviepy
star7.1k
Python
avatar

VideoLingo

Netflix-level subtitle cutting, translation, alignment, and even dubbing - one-click fully automated AI video subtitle team | Netflix级字幕切割、翻译、对齐、甚至加上配音,一键全自动视频搬运AI字幕组

ai-translation dubbing localization video-translation voice-cloning
star15.2k
Python
avatar

ControlNetPlus

ControlNetPlus ControlNet++: 适用于图像生成和编辑的一体化ControlNet! ***我们设计了一种新架构,可在条件文本到图像生成中支持10多种控制类型,并能生成与midjourney视觉上相媲美的高分辨率图像***。该网络基于原始ControlNet架构,我们提出了两个新模块:1. 扩展原始ControlNet以使用相同的网络参数支持不同的图像条件。2. 在不增加计算负担的情况下支持多个条件输入,这对于希望详细编辑图像的设计师尤其重要。不同条件使用相同的条件编码器,无需增加额外的计算或参数。我们在SDXL上进行了彻底的实验,在控制能力和美学评分方面均表现出色

star2.1k
Python
avatar

pyJianYingDraft

轻量、灵活、易上手的Python剪映草稿生成及导出工具,构建全自动化视频剪辑/混剪流水线。本项目的CapCut版本正于 https://github.com/GuanYixuan/pyCapCut 内开发

api automation capcut jianying video-editing
star2.2k
Python
avatar

CodeGeeX4

🏠 Homepage|🛠 Extensions VS Code, Jetbrains|🤗 HF Repo | 🪧 HF DEMO English./README.md | 中文./README_zh.md | 日本語./README_ja.md CodeGeeX4: 全能的开源多语言代码生成模型 我们推出了 CodeGeeX4-ALL-9B,这是最新的 CodeGeeX4 系列模型的开源版本。该模型是在 GLM-4-9Bhttps://github.com/THUDM/GLM-4 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模

star2.3k
Python
avatar

Yuxi-Know

结合LightRAG 知识库的知识图谱智能体平台。LangChain v1 + Vue + FastAPI。集成主流大模型、LightRAG、MinerU、PP-Structure、Neo4j 、联网检索、工具调用。

docker fastapi kbqa kgqa llms
star2.3k
Python
avatar

bilive

极快的B站直播录制、自动切片、自动渲染弹幕以及字幕并投稿至B站,综合多种模态模型,兼容超低配置机器。Extremely fast live recording, automatic slicing, rendering, uploading and Integrating MLLMs. Compatible with low configurations machines.

ass bili bilibili bilive danmaku
star3.0k
Python
avatar

Kolors

中文&nbsp | &nbspEnglish&nbsp --> -->             Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis 目录 - 🎉 新闻新闻 - 📑 开源计划开源计划 - 📖 模型介绍模型介绍 - 📊 评测表现 🥇🥇🔥🔥评测表现 - 🎥 可视化可视化 - 🛠️ 快速使用快速使用

star4.6k
Python