How to Extract All URLs from a Web Page using PHP

Extract URLs from the website is used in many cases, generating a sitemap from website URL is one of them. You can easily get all URLs from a web page using PHP. Here we’ll provide short and simple code snippets to extract all URLs from a web page in PHP.

The following PHP code helps to get all the links from a web page URL. The file_get_contents() function is used to get webpage content from URL. Fetched web page content is stored in $urlContent variable. All the URLs or links are extracted from web page HTML content using DOMDocument class. All links will validate using FILTER_VALIDATE_URL before return and print if it is a valid URL.

$urlContent file_get_contents('http://php.net');

$dom = new DOMDocument();
@
$dom->loadHTML($urlContent);
$xpath = new DOMXPath($dom);
$hrefs $xpath->evaluate("/html/body//a");

for(
$i 0$i $hrefs->length$i++){
    
$href $hrefs->item($i);
    
$url $href->getAttribute('href');
    
$url filter_var($urlFILTER_SANITIZE_URL);
    
// validate url
    
if(!filter_var($urlFILTER_VALIDATE_URL) === false){
        echo 
'<a href="'.$url.'">'.$url.'</a><br />';
    }
}

 

 

  • 1 کاربر این مقاله را مفید می دانند
آیا این پاسخ مفید بود؟

مقالات مرتبط

8 روش استفاده از API اینستاگرام

یکی از محبوبترین پلت فرم های به اشتراک گذاری عکس و ویدیو در وب اینستاگرام می باشد. این برنامه...

بهترین فریم ورک های پی اچ پی (۲۰۱۶)

پی‌اچ‌پی شناخته ترین و پرکاربردترین زبان برنامه نویسی سمت سرور است. امروزه برنامه نویسی تحت وب...

معرفی توابع کاربردی پایگاه داده MySQL در زبان PHP

علامت * یعنی توابعی که در این بخش راجع به آن ها صحبت خواهد شد.علامت ** یعتی قسمت هایی که در صورت...

تفاوت mysql_fetch_assoc و mysql_fetch_array و mysql_fetch_row

در mysql_fetch_array میشه نتایج کوئری رو بصورت آرایه ذخیره کرد. mysql_fetch_array آرایه با اندیس...

۱۰ اشتباه برنامه نویسان در MySQL

طراحی مناسب دیتابیس(یا پایگاه داده) در وبسایتها و برنامه‏های تحت وب، تاثیری زیادی در کارایی و...