<?php

//$argv[1]
//tester l'existence du fichier passé en paramètre
if (file_exists($argv[1]))
{
//stocke les données dans un tableau
    $tableau = file($argv[1]);
        //lecture ligne à ligne
    while(list($cle,$val) = each($tableau))
        {
            $donnees.=$val;
        }
        
        //création du motif permettant de récupérer tout les urls
    $motif='#href="([^"]*)"|src="([^"]*)"#';
        //application du motif de recherche
    preg_match_all($motif, $donnees, $out);
        
        //on récupère le nombre de résultat
    $count1=count($out[0]);
    $k=0;
        
        //premier boucle permet chaque motif
        //extrait le contenu des href ([^"]*) et le contenu des src ([^"]*)
        //$out[1][0] -> premier motif et résultat de la première case
        //$out[2][1] -> deuxieme motif et résultat de la deuxième case
        //si $out[1][5] contient une donnée $out[2][5] sera vide.
    for($i=1;$i<=2;$i++)
        {
        //deuxième boucle permet d'extraire le résultat de chaque motif
            for($j=0;$j<$count1;$j++)
                {
                //vérifie si le champs est vide et si l'url se termine par une extension
                    if($out[$i][$j]!="" && preg_match("/\.[a-z]{3}$/i",$out[$i][$j]))
                        {
                        //si l'url contient http rien à faire
                            if(preg_match("/http/i",$out[$i][$j]))
                                    $tab[$k++]= "".$out[$i][$j]."\n";
                                        //sinon rajouter la racine de vos médias
                                else
                                    $tab[$k++]= "http://blog.creaone.fr".$out[$i][$j]."\n";
                        }
                }
        }

    $c=0;
        // supprime les doublons dans le tableau tab
        while(list($r,$v)=each($tab)) $b[$v]++;
        while(list($r,$v)=each($b))  echo $r; //$tab2[$c++]=$r
                //print_r($tab2);
}

?>