本文主要是提取今日头条URL里面的数字也是文章的唯一标识ID
先看几个不同的地址
头条视频的链接有多种,为了统一,把数字提取出来构造地址
……
最终要构造成第三个地址,也是最终地址
这个6309723881192227073(19位数字就是文章的唯一标识,每篇文章都不同的)
主要是用到这个函数:用到这个函数preg_match().
定义和用法
preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法
preg_match (pattern , subject, matches)
参数 | 描述 |
---|---|
pattern | 正则表达式 |
subject | 需要匹配检索的对象 |
matches | 可选,存储匹配结果的数组 |
例子 1
<?php
// 模式定界符后面的 “i” 表示不区分大小写字母的搜索
if (preg_match (“/net/i”, “Welcome to luluit.net.”))
{
echo “卤卤虾”;
}
else
{
echo “A match was not found.”;
}
?>
输出:
卤卤虾
开始我们的头条URL匹配,代码如下
if(preg_match(‘/([0-9]{19})/’,$url,$arry))
{
$url=””.$arry[0];
}
正则/([0-9]{19})/,匹配的是19位的纯数字
$arry是匹配后的数组
验证地址:top.luluit.net