2010年3月13日土曜日

Simple@Idx 2010/03/13

前回から3週間と短い間隔でSimple。
う、何しよう?
面倒なので、思いっきり仕事することに決定。

HTMLデザイン&スクレイピング

お得意様のウェブサイトはこつこつと10年かけて作り上げたもので、全部で1000ページ以上あります。これのリニューアルをしたいと、長いこと話をしてたのですが、さすがに手間とお金を考えて二の足を踏んでました。

で、この間ですが意を決して、リニューアルすることにしました。
方法は、PHPを使ってスクレイピングを利用すること。
まず、.htaccessファイルを使って、すべてのHTMLファイルをPHPファイルとして認識させ、つぎにHTMLファイルについて、あるPHPファイルを読み込みます。
AddType application/x-httpd-php .html .php
<Files ~ "\.html">
php_value auto_prepend_file '/usr/.../scrape.php'
</Files>
この、「scrape.php」でHTMLファイルを読み込んで、Bodyタグに囲まれた部分だけを抽出して、前後にメニューとフッターを出力して出来上がりです。

やってみたら数時間でひとまず完成。
まぁ本番環境でどうなるかはわかりませんが、開発環境では意外と簡単に動きました。

ついでにHTMLのデザインも。

開発環境でVirtualHostを使ってみる

HTMLをデザインしていて、DocumentRootが違うと面倒なことが多い。VirtualHostを設定してみたところ、
「client denied by server configuration:」とか吐いたままストップ。

ひとまず、Aliasだけ設定して作業を進めてたが、いよいよデザインの段階でにっちもさっちも行かず、調べてみた。らすぐに原因がわかった。
http://blog.plastik.jp/archives/24

0 件のコメント: