官网的大号Tifa模型实际上是Claude API,您为何要谎称您有大模型?

#20
by deleted - opened
deleted

image.png

您甚至不愿意修改一下前端请求的模型名称

image.png

image.png

这不禁令人想起之前的 Reflection 70B 模型,实际上是用Claude API作为后端,而开源了较差的finetune模型,期望可以用“优秀”的“官方API表现”,与小的finetune模型相互混淆,企图欺骗投资人: https://www.reddit.com/r/LocalLLaMA/comments/1fc98fu/confirmed_reflection_70bs_official_api_is_sonnet/?rdt=50647

澄清公告
对于Mode Name我有足够的自由进行自由裁定。而且具体是不是Claude我认为是能够感受出来的。

我们与Claude还有较大差距,还在追赶中,如果你认为Ultra有这个性能,我也很开心。

最后这位显然违背开源共享精神,试图使用错误的推论引导舆论,其影响和背后的用心难测。技术验证之后都会进行共享,所以请勿传播不实信息。

deleted

您是说您官网的Tifa-Ultra在API的model-name刚好叫claude-3-5-sonnet吗?

你自己试试啊...又不是试不出来。明显不是Claude啊。

我认为作为一个有承担的人来说,自己散播的谣言是有责任自己去消除影响的。model的name之所以用sonnet的名字是为了和之前我们内部系统无缝衔接,因为有些代码老旧,修改有阻力。所以无法及时改正。而我们恰好可以修改模型名来兼容。

但是模型能被人为是Sonnet...还是挺意外的。因为不管是安全性还是通用能力,Sonnet都是我们追赶的对象,也是短期目标。对我而言,它们两者的区别太过于明显,以至于我认为任何一个熟悉大模型的人大概率不会搞错吧。

您不需要像 Reflection 70B 一样在被抓到之后,尝试在不同模型之间切换来证明什么。

Reflection 70B在被发现之后,在Claude-sonnet、gpt4o、LLaMA 70B之间来回切换,至今仍让人们津津乐道。

1、我们API正常运行状态,如果我能用更低成本的自研模型。我为何之前接入高成本模型?而且接入需要服务器,我回复你消息在分钟间,根本没时间准备。
2、我们API对外售价暂定8元,是Sonnet官方的近百分之一,没动机啊。
3、我们从未接受投资,也未开放投资,我们上游是一家工业公司,处于业界领先地位,资金并不是我们的瓶颈。
4、我们确实在验证模型技术,而且在积极推进资源共享。未已牟利为目的,相反我认为你的行为是否属于商业竞争?试图阻碍技术交流?

无从测试您的API和定价策略,因为只有“联系销售人员”选项。

至于3、4 ,下面这段话摘自您的模型卡片,相信不只有我不理解其中除了堆砌一些互不相关的词汇之外有任何逻辑:

MGRPO与层传播:
算法改变:原始GRPO仅通过ORM策略进行偏好学习,但无法评判文学内容生成质量,本次训练使用上海交通大学博士魏XX、洪XX的启发,使用逻辑学算法,解决文学ORM策略设计难点,并且二次返回修改提示词进行错误总结。每次调整均经历2次完整传播过程,为GRPO+GRPO,所以暂时命名为MGRPO。
构架改变:尝试改变Transformers传播方式,在层内循环处理进行训练,受到Universal Transformers与最新潜空间启发,在训练中让部分层循环激活,为了避免梯度爆炸使用梯度裁切技术,测试发现模型性能得到提升,更多工作还在测试中。

而您提到的层内循环架构改变也没有在您发布的模型权重上体现。更不理解上海交通大学博士魏XX、洪XX有何原因,连姓名都要这样表示。

包括您给模型起名“Deepsex”,这个令人尴尬的名字,无疑也是引起噱头和进一步炒作的铺垫。

如果诚实成了您的负担,那么确实您不需要再证明什么了。

我贴出了训练日志,可以明显看到有打分内容。而内循环本身就是已经实现过的内容。我认为,作为一个有担当的国人(当然你可能不是),对于谣言的散播应该是不齿的。弥补性的消除自己的影响是最基本的素质,如果你觉得哪里不对,那也无妨,我并不会在背后使用什么手段或者再证明什么。我会继续开源更多模型。也会继续共享更多技术思路。

但我也相信,可能未来某一天你会想起你对于我们的污蔑,我并不觉得你会把此当作骄傲。

Deepsex的名字我早已澄清,模型训练也加入了安全审核,我们做了什么,大家都能看到。

清者自清,地球上的人那么多,傻逼应付不过来的。

我认为您应该开源mgrpo和层传播训练, 不然傻逼太多了, 总得让人知道您这公司是有料的.

mgrpo有啥好开源的。GRPO的脚本把反向传播前那部分类啥的复制一份,然后不是有orm评分么。排个序,再用llm写个提示词插入上下文再输出一次。就完事了。没啥算法。循环曾就是扒代码,说实话我都看不懂。但是跑起来了...

我做的都是方法类实践,大佬们做的是算法类实践。ORM的评分机制是主要的。其他的多复制几个rl类真的没啥东西。

真有这么便宜的sonnet我就要狠狠接入cline了🥵🥵🥵🥵

1、我们API正常运行状态,如果我能用更低成本的自研模型。我为何之前接入高成本模型?而且接入需要服务器,我回复你消息在分钟间,根本没时间准备。
2、我们API对外售价暂定8元,是Sonnet官方的近百分之一,没动机啊。
3、我们从未接受投资,也未开放投资,我们上游是一家工业公司,处于业界领先地位,资金并不是我们的瓶颈。
4、我们确实在验证模型技术,而且在积极推进资源共享。未已牟利为目的,相反我认为你的行为是否属于商业竞争?试图阻碍技术交流?

api对外销售吗()

Sign up or log in to comment