论文查重怎么查?工具+案例

  • A+
所属分类:生财星球

昨天有人提到论文查重,我来分享几个关于这个主题的案例。
这个细分市场工具有不少,看数据也都活的挺好,但是还有很多不足的空间,现在进入还有机会。

查重有2个关键点

1.初始的数据库。

a.很多工具站并不自己建数据库,他们只是将你提供的文章打散成句子或者词组之后在现有的搜索引擎(比如百度或者搜狗或者Google)中去检索相似句子,然后判断是否有抄袭或者重复文章,这种类型的网站大多数是免费提供服务,提供一些增值服务或者广告收费。
b.另外是自己建立数据库,比如说自己抓取了很多文章,或者买断了很多独家内容,比如知网这种类型的,靠收费赚钱。

2.文章之间的比对。

a.文章比对上难度还是有一点,需要用到一点算法知识,但网络上都有开源的算法。
基于上面两点,目前已经有的切入的场景

1.查文章是否首发,是否原创,主要是老板查小编是否真的在写内容而不是从网上随便下载了一些文章组合起来。这个场景下,国外的工具比较多,国内反而我没怎么见到。也许是一个好机会。

2.两篇文章的相似性比对,输入两篇文章的url,或者提供两篇文章,直接标记出来相似的地方在哪里,类似于知网查重产出的报告一样,这种需求我个人感觉还是蛮多的。但国内一直没人做好,可能是技术难度有点大?

3.文章语法与文字纠错工,写完了一篇文章想查一下哪里有错别字,哪里语法不通。英文这样的工具非常多,而且流量特别大。中文的这样的做的好的工具不多,可能是因为中文查错别字比较慢?但需求确实真实的,几乎每个写作的人都希望有这样一款工具可以在线查一下哪里可能有错别字,有标点错误(并非每个人都会去装一个word),曾经有一个朋友直接表示过,这样的工具开发出来每个月愿意花几十块钱订阅,有技术的朋友试试看。

 

4.舆情监测与版权监测。先前置一篇文章或者一些关键词,然后定时去查网络上相似或者相关的内容。做的大的有很多了。

案例:

Google搜索下:copyright check online

第一个网站:④Online Copyright Protection流量:月120万。

商业模式:免费对比服务+单次服务收费$0.05/

API收费/版权追踪分析工具

简单收入预估:月流量120万*每个人每个月使用10次($0.5)=60万美元,有点夸张,再打个5折,收入30万美元,成本几乎可以忽略不计。增长黑客思路:他们建立一个认证系统,提供了一个版权保护的小挂件,写作的人可以将这个挂件放到自己的网站上,挂件上写着[protected by copyscapeJ,意思是我的网站目前在版权保护中,不要来抄我内容blabla。但核心是这个网站通过这个小挂件给自己提供了非常多的高质量的外链。

可以换个搜索词比如dupilcate content check等,也是很多类似的机会。

总结下,这个细分市场应该还是有很大的机会,特别是在中文内容创业如火如茶的情况下,对应的很多服务没有跟上,推荐有技术的跟进。

jingying

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: