【文件属性】:
文件名称:simhashphp:SimHash相似性算法PHP实现
文件大小:25KB
文件格式:ZIP
更新时间:2021-05-06 21:50:24
PHP
SimHashPHP
这是SimHashPHP的第二个版本。 如果您使用的是版本1,并且不想更新代码,请参阅1.0-security分支( )。 1.0分支将一直保持到v3发行,但只有v2具有最新功能。
什么是SimHashPHP?
SimHashPHP是一个PHP库,可在PHP中移植SimHash算法。 由Moses Charikar创建的该算法提供了一种有效的方法来计算两个文本之间的相似性索引。 Google内部使用它来检测重复的内容。
有关更多信息,请参见 。
如何使用它 ?
用安装它:
composer require tga/simhash-php
安装后,包括vendor/autoload.php来加载库。
介绍了SimHash的概念。 以下是一些示例:
<?php
require 'vendor/autoload.php' ;
$ text1 = <<<EO
【文件预览】:
simhashphp-master
----lib()
--------Tga()
----phpunit.xml.dist(278B)
----doc()
--------examples()
----.travis.yml(96B)
----LICENSE.md(1KB)
----README.md(4KB)
----tests()
--------src()
--------autoload.php(51B)
--------resources()
----.gitignore(26B)
----composer.json(620B)