hub

CodeZen

CodeZen

一个专注中文区的 GitHub 项目发现

avatar

Show-o

One Single Transformer to Unify Multimodal Understanding and Generation Jinheng Xiehttps://sierkinhane.github.io/1&42;  Weijia Maohttps://scholar.google.com/citations?hl=zh-CN&user=S7bGBmkyNtEC&view_op=list_works&sortby=pubdate1&42;  Zechen Baihttps://www.baizechen.site/1&42;  David

diffusion-models large-language-models multimodal
star1.8k
Python
avatar

LongWriter

LongWriter:释放长上下文LLM的10,000+字生成能力 🤗 HF 仓库 • 📃 论文 • 🚀 HF 空间 English./README.md | 中文./README_zh.md | 日本語./README_jp.md https://github.com/user-attachments/assets/c7eedeca-98ed-43ec-8619-25137987bcde 左:LongWriter-glm4-9b;右:GLM-4-9B-chat 🔥 更新 **2024年8月18日** 您现在可以使用vllmhttps://github.com/vllm-

fine-tuning llm long-context long-text
star1.8k
Python
avatar

ProxyCat

一款部署于云端或本地的隧道代理池中间件,可将静态代理IP灵活运用成隧道IP,提供固定请求地址,一次部署终身使用

cyber-security cyber-security-tool proxy proxypool security
star2.3k
Python
avatar

VITA

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction 📖 VITA-1.5 Paperhttps://arxiv.org/pdf/2501.01957 🤖 Basic Demohttps://modelscope.cn/studios/modelscope/VITA1.5_demo 🍎 VITA-1.0https://vita-home.github.io/ 💬 WeChat 微信./asset/wechat-group.jpg --- 📽 VITA-1.5 De

large-multimodal-models multimodal-large-language-models omni-language-model omni-modal-video-understanding omni-model
star2.4k
Python
avatar

llm_related

复现大模型相关算法及一些学习记录

star2.5k
Python
avatar

D-FINE

English | 简体中文README_cn.md | 日本語README_ja.md | English Blogsrc/zoo/dfine/blog.md | 中文博客src/zoo/dfine/blog_cn.md D-FINE: Redefine Regression Task of DETRs as Fine&8209;grained Distribution Refinement

d-fine detr object-detection
star2.8k
Python
avatar

LiYing

LiYing is an automated photo processing program designed for automating the post-processing workflow of ID photos in general photo studios. | LiYing 是一套适用于自动化 完成一般照相馆后期证件照处理流程的照片自动处理的程序。

background-replacement image-compression image-cropping photo-layout photo-processing
star3.0k
Python
avatar

NarratoAI

利用AI大模型,一键解说并剪辑视频; Using AI models to automatically provide commentary and edit videos with a single click.

aiagent aiops gemini-api llm moviepy
star7.1k
Python
avatar

VideoLingo

Netflix-level subtitle cutting, translation, alignment, and even dubbing - one-click fully automated AI video subtitle team | Netflix级字幕切割、翻译、对齐、甚至加上配音,一键全自动视频搬运AI字幕组

ai-translation dubbing localization video-translation voice-cloning
star15.2k
Python
avatar

ControlNetPlus

ControlNetPlus ControlNet++: 适用于图像生成和编辑的一体化ControlNet! ***我们设计了一种新架构,可在条件文本到图像生成中支持10多种控制类型,并能生成与midjourney视觉上相媲美的高分辨率图像***。该网络基于原始ControlNet架构,我们提出了两个新模块:1. 扩展原始ControlNet以使用相同的网络参数支持不同的图像条件。2. 在不增加计算负担的情况下支持多个条件输入,这对于希望详细编辑图像的设计师尤其重要。不同条件使用相同的条件编码器,无需增加额外的计算或参数。我们在SDXL上进行了彻底的实验,在控制能力和美学评分方面均表现出色

star2.1k
Python
avatar

pyJianYingDraft

轻量、灵活、易上手的Python剪映草稿生成及导出工具,构建全自动化视频剪辑/混剪流水线。本项目的CapCut版本正于 https://github.com/GuanYixuan/pyCapCut 内开发

api automation capcut jianying video-editing
star2.2k
Python
avatar

CodeGeeX4

🏠 Homepage|🛠 Extensions VS Code, Jetbrains|🤗 HF Repo | 🪧 HF DEMO English./README.md | 中文./README_zh.md | 日本語./README_ja.md CodeGeeX4: 全能的开源多语言代码生成模型 我们推出了 CodeGeeX4-ALL-9B,这是最新的 CodeGeeX4 系列模型的开源版本。该模型是在 GLM-4-9Bhttps://github.com/THUDM/GLM-4 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模

star2.3k
Python