不論是從seo還是用戶的角度來考慮,規范的標點符號都是有益的,所以我們需要對html代碼中的標題符號進行處理,尤其是采集來的內容,其中的標點符號可能不規范。
先說說用戶角度來看標點符號。中文標點除了斷句外,也是很好的視覺分割,讓閱讀更容易,這一點毋庸置疑,不信你可以復制一篇文章,把其中的中文標點符號換成英文試試。
再說說從seo角度來看。大家都用過word吧,其中的語法錯誤提示就能識別中文中的英文標點,算是錯誤。而以百度為首的搜索引擎在這方面也是有考量的,過多的“語法錯誤”會拉低文檔的質量,如百度官網中就曾提到關于標題中的標點符號的使用(具體請自行搜索),內容部分也就毋庸置疑了。
說了這么多,我們來看一下這個中英文標點符號互換的js函數吧!
_source=[',','\\.','!','\\?',':',';','\\(','\\)','\\[','\\]','\\{','\\}','\'','"','\\\\','\\\/','<','>'], _replace=[',','。','!','?',':',';','(',')','【','】','{','}','‘','“','、','、','《','》'], _tmp=new Array(); _tmp[12]='’'; _tmp[13]='”'; for(i=0;i<_source.length;i++){ var v=_source; var rep = RegExp(v,'gi'); if(i==12 || i==13){ var j=0; str=str.replace(rep,function(match){ j++; if(j%2==0){ return _tmp; }else{ return _replace; } }) }else{ str=str.replace(rep,_replace); } } return str; }
說白了,還是很簡單的,就是正則替換。你可以在編輯器調用,提交之前對于用戶編輯的內容進行處理,或者采集后對內容批量處理,當然你也可以把它改成php的來用。
© 致遠 2020-01-18,原創內容,轉載請注明出錯:一個中英文標點符號互換的js函數