+
全部博文
76
全部博文
75
工作日志
0
日常记录
0
转贴的文章
资讯
问答
评论
排序
按时间
按阅读量
创作历程
全部
2026年(7篇)
7
2026/01
2025年(45篇)
4
2025/12
6
2025/11
1
2025/10
4
2025/09
6
2025/07
2
2025/06
5
2025/05
3
2025/04
4
2025/03
8
2025/02
2
2025/01
2024年(24篇)
6
2024/12
5
2024/11
2
2024/10
1
2024/09
2
2024/07
3
2024/06
3
2024/05
2
2024/04
顶
原
RWKV 社区 2 月动态:10 篇新学术论文!
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2025 年 2 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 2 月都有哪些新鲜事! 2 月动态省流版(TL;DR) RWKV 学术研究动...
RWKV学术研究动态
OmniRWKVSR
ET_MGNN
RWKV-UI
LALIC
RWKV工业缺陷检测
工作日志
2025/03/03 16:25
383
0
顶
原
RWKV-7 论文即将发布,推理模型 G1 系列训练中!国外社区发布 72B 模型
其实 RWKV-7 是训练一个模型,使其可以自动训练模型中的模型。每个 RWKV-7 内有多个小模型,RWKV-7 在推理时会自动训练这些小模型。RWKV-7 的 state 就是这些小模型的参数。 例如 RWKV-7 7B ...
RWKV-7
小模型
state更新
推理模型
数据集
模型训练
工作日志
2025/02/28 14:03
557
0
顶
原
RWKV开发者大会2025:全球数万开发者探讨RWKV-7超越Transformer
2025年2月22日,RWKV在上海漕河泾举办了主题为《RWKV-7与未来趋势》的开发者大会。来自全国各地的开发者、行业专家和技术创新者齐聚一堂——从知名高校实验室到前沿创业团队,现场涌动的创新...
RWKV-7
开发者大会
视觉-语言表征
多模态数据压缩
医学图像分割
工作日志
2025/02/26 16:13
349
0
顶
原
Stanford 团队展现 RWKV 多智能体优势,UVa 团队突破 RWKV 端侧性能
近日 RWKV 生态新增来自海外名校的两项工作:Stanford(斯坦福大学)团队的 RWKV 多智能体研究,和 UVa(弗吉尼亚大学) 团队的 RWKV 端侧优化研究。 RWKV 多智能体强化学习 开源项目地址:h...
RWKV多智能体
端侧优化
社交推理
自我对抗学习
KL约束
RWKV模型
工作日志
2025/02/18 17:30
365
0
顶
原
RWKV首届全球开发者大会定档2月21日,研讨RWKV-7架构与未来趋势
新一代大模型架构 RWKV 将于 2025 年 2 月 22 日在上海举办首届主题为 《RWKV-7 架构与未来趋势》 的开发者大会,大会将深入探讨 RWKV-7 的独家技术亮点、应用场景以及未来趋势,展示 RWKV 在...
大模型架构
RWKV-7
动态状态演化
上下文学习
持续学习
test-time training
工作日志
2025/02/17 10:50
360
0
顶
原
RWKV 2025 生态内容征集大赛 | 1 月投稿作品及评审结果
大家好,我们在 2024 年底推出了 “RWKV 2025 生态内容征集大赛”,公开征集 RWKV 相关的作品,包括但不限于 RWKV 相关的论文、讲解 RWKV 的教程,以及基于 RWKV 的应用等。 2025 年 1 月,活...
rwkv
https
github
pip
translator
modelscope
kdenlive
翻译工具
demo
lyyyy
beortust
zerocot
工作日志
2025/02/12 17:57
190
0
顶
原
RWKV-7 2.9B 模型正式发布,SOTA 架构,带来 SOTA 使用体验
2025 年 2 月 11 日,RWKV 基金会正式发布 RWKV-7-World-2.9B-V3 模型(以下简称 RWKV-7-2.9B)。 RWKV-7-2.9B 模型基于 RWKV World V3 数据集训练。无论是模型评测还是实际体验,RWKV-7-2....
rwkv
https
prompts
qwen2
modelscope
mirror
llama3
context
开源模型
community
gradio
eagle
工作日志
2025/02/12 10:39
441
0
顶
原
RWKV 社区动态 2025 年 1 月
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2025 年 1 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 1 月都有哪些新鲜事! 1 月动态省流版(TL;DR) RWKV 学术研究动...
rwkv
https
知识图谱
github
lora
tl;dr
glab
llava
高斯混合模型
k
神经网络
fst
arxiv
工作日志
2025/02/10 11:35
258
0
顶
原
RWKV-7 1.5B 基底模型发布,我们必将能在手机高效跑1T参数模型
除夕快乐!在除旧迎新之际,我们也正式发布 RWKV-7-World-1.5B-v3 基底模型!(下文简称为 RWKV-7-1.5B 模型) RWKV-7-1.5B 模型基于 RWKV World v3 数据集(共 3.1T 数据)训练而来。在英文...
rwkv
https
mirror
community
qwen2
开源模型
gradio
context
深度学习
finch
eagle
world
工作日志
2025/02/05 15:58
505
0
顶
原
RWKV-7-0.4B 模型正式发布,社区发布多款基于 RWKV-7 的新项目!
RWKV-7-World-0.4B-v2.9 模型于 2025 年 1 月 8 日正式发布! 随着 RWKV-7 架构的发布,RWKV 社区也开源发布了多款基于 RWKV-7 的新项目,包括 RWKV-7-WebGPU Demo 和 基于 RWKV-7 架构的 Co...
rwkv
https
modelscope
github
浏览器
可视化
web-
prompt
world
益智游戏
gradio
finch
eagle
工作日志
2025/01/13 11:05
662
0
顶
原
元始智能完成数千万级天使轮融资,加速生态发展与AI应用
【深圳,2025年1月3日】深圳元始智能有限公司(以下简称“元始智能”)宣布已于 2024 年 12 月 25 日走完工商变更,成功完成数千万级人民币天使轮融资,本轮投资方为天际资本。此次融资将为元...
rwkv
人工智能
windows
开源
dify
开源中国
开源社区
rwkvos
attention
world0
transformer
工作日志
2025/01/03 15:55
424
0
顶
原
RWKV生态内容征集大赛(2025年)正式启动,赏金+周边,等你挑战!
很高兴告诉大家:RWKV 社区推出"RWKV 生态内容征集大赛 ",此活动在 2025 年全年内公开征集 RWKV 相关的内容,包括: 与 RWKV 相关的论文 讲解 RWKV 的教程,例如文章、视频、动画 基于 RWKV...
工作日志
2024/12/31 17:15
313
0
顶
原
RWKV社区 12 月动态速览!
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2024 年 12 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 12 月都有哪些新鲜事! 12 月动态省流版(TL;DR) RWKV 学术研究...
rwkv
https
pcf
浏览器
开源
preview
github
深度学习
gzip
lora
modelscope
mirror
web-
tl;dr
工作日志
2024/12/31 16:55
336
0
顶
原
RWKV-7:极先进的大模型架构,长文本能力极强
RWKV-7 是极先进的最新大模型架构,超越 attention / linear attention 范式,拥有强大的 in-context-learning(上下文学习)能力,可真正持续学习,在保持 100% RNN 的同时,拥有极强的长文...
rwkv
https
context
web-
rwkv-lm
world
eagle
runner
finch
goose
github
神经网络
pythia
工作日志
2024/12/23 11:22
611
0
顶
原
RWKV-7-World-0.1B 发布,RWKV-6-32B-Instruct 由海外社区发布
2024 年 12 月 11 日,RWKV 基金会正式发布了首款 RWKV-7 架构模型:RWKV-7-World-0.1B-v2.8。 同日,RWKV 海外社区团队发布了 QRWKV6-32B-Instruct-Preview-v0.1 模型,这是迄今最大规模的 ...
rwkv
https
preview
modelscope
qwen2
mirror
instruct
world
blink
神经网络
大数据
qrwkv6
工作日志
2024/12/12 17:28
276
0
顶
原
基于 RWKV 的视觉语言模型 VisualRWKV 被 COLING 2025 接收!
基于 RWKV 的视觉语言模型 VisualRWKV 被 COLING 2025 接收! COLING,国际计算语言学会议(International Conference on Computational Linguistics),是自然语言处理和计算语言学领域的顶...
rwkv
llava
data
大型语言模型
https
自然语言处理
visualrwkv
递归神经网络
lora
工作日志
2024/12/05 18:27
268
0
顶
原
RWKV AI 大模型已完成生成式人工智能服务备案
2024年12月2日,元始智能自主研发的 RWKV AI 大模型已成功通过国家互联网信息办公室的生成式人工智能服务备案。这标志着 RWKV AI 大模型在 AI 技术安全、内容合规、数据管理及安全防护等方面...
工作日志
2024/12/04 14:20
285
0
顶
原
大量新论文、RWKV-7 架构已定档......RWKV 社区 11 月动态速览!
欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2024 年 11 月的最新动态。 只需 3 分钟,快速了解 RWKV 社区 11 月都有哪些新鲜事! 11 月动态省流版(TL;DR) RWKV 学术研究...
rwkv
https
sudoku-
开源
拼音输入法
github
windows
强化学习
download
modelscope
chatrwkv
工作日志
2024/11/29 18:47
516
0
顶
原
荐
RWKV 已部署到 5 亿台 Windows 电脑?真正开源的新一代 AI 架构
2024 年 9 月 ,RWKV 社区成员发现:Office 系统在自动更新后(版本 2407 及以后)已自带 RWKV 运行库。 在 Windows 系统的 C:\Program Files\Microsoft Office\root\vfs\ProgramFilesCommo...
rwkv
llama
https
windows
prompt
finch-
操作系统
开源
index-
html
build
parallel
release
工作日志
2024/09/05 11:43
1.9K
0
顶
原
RWKV 模型 state tuning 微调训练教程
RWKV State 微调是什么? RWKV 是纯 RNN,因此可以做 transformer 难以做到的事情。例如,作为 RNN 有固定大小的 state,所以,微调 RWKV 的初始 state,就相当于最彻底的 prompt tuning,甚...
rwkv
https
cuda
epoch
data
deepspeed
文件路径
lightning
micro
conda
linux
state
layer
make
2048
工作日志
2024/06/19 18:01
851
0
加载更多
下一页
文章删除后无法恢复,确定删除此文章吗?
取消
确定
动弹删除后,数据将无法恢复
取消
确定
©OSCHINA(OSChina.NET)
工信部
开源软件推进联盟
指定官方社区
社区规范
北京奥思研工智能科技有限公司版权所有
京ICP备2025119063号
顶部
原文链接: [https://my.oschina.net/u/7093160](https://my.oschina.net/u/7093160)