2022年AG百家乐假不假 DeepSeek缝合Claude,比单用R1/o1遵守王人好!GitHub揽星3k
发布日期:2024-05-09 01:13 点击次数:135梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI2022年AG百家乐假不假
DeepSeek代替Claude念念考,缝合怪玩法火了。
原因无它:比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模子的遵守更好
先来看一段VCR:

视频贯串:https://mp.weixin.qq.com/s/vhv4Eb5XoA2d4LKRqVRQag?token=1656933192&lang=zh_CN
再来看一个测评死心:
代码剪辑基准Polyglot Benchmark上,缝合模子遵守小超o1-high和R1一头。

在这个测试中,R1上演架构师,刻画奈那儿理代码问题。
Claude上演步调员,按条目生成特定的代码剪辑教唆,以便把更动应用到源文献中。
除此除外,执行经过中还得出还有几个有益念念的论断:
o1与Claude Sonnet搭配遵守并不如单独使用o1。使用R1或o1当架构师,Claude除外的其他模子当步调员,遵守王人不如单独使用R1或o1。o1-preview和o1-mini当架构师,使用好多不同的模子当步调员王人能进步组合的收货。使用R1的推理经过token遵守不如使用R1的最终输出token。
这么看来,R1和Claude Sonnet还简直一双绝配啊~

DeepClaude应用本人100%免费且开源,在GitHub上已揽获3k星星(固然API要用我方的)。

网友测试后转头到:Claude擅长撰写显着、结构精致的文本和代码,因此它能将DeepSeek-R1的见识转换为精熟的回复。

DeepClaude作家之一双此有感而发:
AI智能体和智能体应用正在展示出一种“数字宇宙优先”的范式诊治,智能系统正在成为主动的协作家,而不单是是被迫的用具。

DeepSeek和Claude的混血儿
具体来说,DeepClaude是一个LLM推理API,通过Rust编写。
它提供了一个协调的接口,将DeepSeek R1的CoT逻辑推理才气和Claude的回复在单一流中无缝相接
建筑者不错通过这个API同期调用两种模子的功能,还能十足掌控我方的API密钥和数据。
打造它的团队名为Asterisk,ag百家乐假不假团队成员具有安全无间&CTF(Capture The Flag)布景,奋力于于欺诈AI让搜检代码安全这事儿变得愈加高效。

团队以为,DeepSeek R1的CoT深度推理以致达到了LLM具有反省默契(metacognition)的进程,它大概自我修订、念念考不常见/极点/罕见的情况,并在当然谈话中进行不异蒙特卡洛树搜索(MCTS)的推理。
不外R1在代码生成、创造力和对话妙技方面有所欠缺,Claude 3.5 Sonnet在这些方面发挥出色,刚好不错作补充。
何不将两者聚集起来?取两者之长,打造出DeepClaude~

对话中,Claude复兴之前,系统会清醒“
”这么的预填充文本。

DeepClaude聚集了这两种模子,具有以下特质:

托管API十足免费,允许用户使用我方的密钥,并将DeepSeek和Claude的流式API整合在一说念,提供计较组合使用量和价钱等便利功能。
代码是开源的,用户不错解放托管、修改和从头分发。团队暗示它一经在Asterisk的坐褥环境中大规模使用,每天处理数百万token,于今尚未出现故障,惟一不浪费就行。
One More Thing
你以为两个模子缝合等于极限了吗?
No no no
还有网友建筑出了三缝合玩法,将DeepSeek-R1和Gemini 2.0 Flash的念念考死心组合起来,在让Claude Sonnet去回答问题。
在GPQA测试(谷歌搜不到的理化生博士级摄取题)中也获取了好收货。

Github地址:https://github.com/getasterisk/deepclaude
[1]https://aider.chat/2025/01/24/r1-sonnet.html[2]https://x.com/deepclaude_/status/1886911416478642279[3]https://x.com/omercelik/status/1883510797193937278[4]https://x.com/mufeedvh/status/1883620781583901011