这里有新鲜出炉的 PHP 设计模式,程序狗速度看过来!
PHP(外文名: Hypertext Preprocessor,中文名:"超文本预处理器")是一种通用开源脚本语言。语法吸收了 C 语言、Java 和 Perl 的特点,入门门槛较低,易于学习,使用广泛,主要适用于 web 开发领域。PHP 的文件后缀名为 php。
这篇文章主要介绍了 PHP 数据分析引擎计算余弦相似度算法, 结合具体实例形式分析了 php 计算余弦相似度的操作步骤与相关实现技巧, 需要的朋友可以参考下
本文实例讲述了 PHP 数据分析引擎计算余弦相似度算法。分享给大家供大家参考,具体如下:
关于余弦相似度的相关介绍可参考百度百科:余弦相似度
- <?php
- /**
- * 数据分析引擎
- * 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。
- * 求出分析向量与基准向量的余弦值
- * @author yu.guo@okhqb.com
- */
- /**
- * 获得向量的模
- * @param unknown_type $array 传入分析数据的基准点的N维向量。|eg:array(1,1,1,1,1);
- */
- function getMarkMod($arrParam){
- $strModDouble = 0;
- foreach($arrParam as $val){
- $strModDouble += $val * $val;
- }
- $strMod = sqrt($strModDouble);
- //是否需要保留小数点后几位
- return $strMod;
- }
- /**
- * 获取标杆的元素个数
- * @param unknown_type $arrParam
- * @return number
- */
- function getMarkLenth($arrParam){
- $intLenth = count($arrParam);
- return $intLenth;
- }
- /**
- * 对传入数组进行索引分配,基准点的索引必须为k,求夹角的向量索引必须为 'j'.
- * @param unknown_type $arrParam
- * @param unknown_type $index
- * @ruturn $arrBack
- */
- function handIndex($arrParam, $index = 'k'){
- foreach($arrParam as $key => $val){
- $in = $index.$key;
- $arrBack[$in] = $val;
- }
- return $arrBack;
- }
- /**
- *
- * @param unknown_type $arrMark标杆向量数组(索引被处理过)
- * @param unknown_type $arrAnaly 分析向量数组 (索引被处理过) |array('j0'=>1,'j1'=>2....)
- * @param unknown_type $strMarkMod标杆向量的模
- * @param unknown_type $intLenth 向量的长度
- */
- function getCosine($arrMark, $arrAnaly, $strMarkMod ,$intLenth){
- $strVector = 0;
- $strCosine = 0;
- for($i = 0; $i < $intLenth; $i++){
- $strMarkVal = $arrMark['k'.$i];
- $strAnalyVal = $arrAnaly['j'.$i];
- $strVector += $strMarkVal * $strAnalyVal;
- }
- $arrAnalyMod = getMarkMod($arrAnaly); //求分析向量的模
- $strFenzi = $strVector;
- $strFenMu = $arrAnalyMod * $strMarkMod;
- $strCosine = $strFenzi / $strFenMu;
- if(0 !== (int)$strFenMu){
- $strCosine = $strFenzi / $strFenMu;
- }
- return $strCosine;
- }
- ?>
希望本文所述对大家 PHP 程序设计有所帮助。
来源: http://www.phperz.com/article/17/0823/344356.html