電子メールの送受信は、インターネット上の多くのメールサーバー(SMTPサーバー)が連携することによって動作している。
一般的に電子メールの送信や他のサーバーへの転送にはSMTPサーバーが、電子メールの受信にはPOP3またはIMAP4サーバーが使用されている。
【 MIME 】(Multipurpose Internet Mail Extension)
インターネットの電子メールの規格を拡張して、さまざまな形式を扱えるようにした規格。もともとのインターネットの電子メールでは、米語(US-ASCII)の半角英数字しか扱えず、1行あたり1000文字までという制限がある。そのため、漢字などの2バイト文字や、画像、音声といったバイナリーデータ(添付ファイル)を扱えるように考案された方式。
MIMEでは、BASE64やQuoted-Printableという方法でメールの内容をテキスト(英数字)データに変換する。メールのヘッダーに変換方法や含まれるデータのタイプを記述し、受信側はその情報に基づいてメールの内容を作成時の状態に復元する。MIMEを使うことで、従来からある電子メールのプロトコルや稼働中のサーバーソフトを変更することなく、電子メールの仕様を拡張できる。
【 SPF 】(Sender Policy Framework)
メールの送信元アドレスの偽装を防止する技術。電子メールにおける送信ドメイン認証のひとつ。差出人のメールアドレスが他のドメインになりすましていないかどうかを検出することができる。 SPF もしくは SPF認証 とも呼ばれる。
無差別に大量に送られる広告メール(SPAMメール)の抑止につながるとして期待されている。
インターネット上の電子メールに用いられる「SMTP」は、差出人のメールアドレスを誰でも自由に名乗ることができる。これにより、迷惑メール送信者、いわゆる「スパマー」による差出人アドレスの詐称が世界各地で行われ、広告メール(SPAMメール)が利用者を悩ませてきた。
あるドメインのメールを送信することができる正規のサーバのIPアドレスをリストして管理する。そのドメインと無関係なメールサーバを利用して送信元を偽ったメールを送信しようとすると、受信側でそのことを検出して自動的に受け取りを拒否することができる。これにより、SPAM業者が大手プロバイダなどの有名なドメイン名を含むメールアドレスを利用することを防ぐことができるようになる。ただし、多くの企業やプロバイダが参加しなければ効果が上がらず、また、SPFが行うのは「差出人アドレスに記載されたドメイン名を読みとり、正しいメールサーバから送信されているかどうかを検出すること」だけなので、SPAM業者が自前ドメインのメールを送信することは防げない。その場合は、受け取りを拒否するドメインのブラックリストを用意するなど、別の対策を併用する必要がある。
メールを受信するメールサーバーが,メール受信時に送信元が正しいかを確認してから受け取るその他の仕組みとして、DKIMとS25Rがあります。
【 DKIM(domain keys identified mail) 】
DKIMは、受信メールサーバーが電子署名の仕組みを利用して送信元を確認する仕組みです。
メール送信時に送信側のメールサーバーで、秘密鍵によってメールのヘッダーと本文から、生成した署名情報を送信メールのヘッダに記述し、送信します。
この秘密鍵に対応した公開鍵を、送信元のDNSへ登録しておきます。
そのメールの受信時、受信側メールサーバーは、送信元ドメインのDNSサーバー上に公開されている公開鍵を取得し、電子署名が正規なものかどうかを判定しています。
これによりメールの送信者(ドメイン)とメール本文の正当性(途中経路で改ざんされていないこと)の両方を確認できます。
【 S25R(selective SMTP Rejection) 】
受信メールサーバーが、メール中継サーバからのSMTPアクセスは受け入れるが、エンドユーザーコンピュータから直接のSMTPアクセスは拒否する方式。
スパムのほとんどは、実際の送信者を偽装するため、ADSLやケーブルネットワークなどのエンドユーザー用回線につながっている、ボットに感染したエンドユーザーコンピュータから直接送られてきます。
よって、SMTPアクセスをかけてきたクライアントがメール中継サーバかエンドユーザーコンピュータかを判別し、スパムを送ろうとするコンピュータからのSMTP接続そのものを拒否します。
拒否ルールの判断は、逆引きができるかどうかで判断します。
正しいメール中継サーバのほとんどは、逆引きで得られるFQDNを設定されています。IPアドレスから逆引きを試みて、FQDNが帰ってくれば正しいメール中継サーバーと判断できます。FQDNを持たなければ、ダイヤルアップ、ADSL、ケーブルネットワークなどのエンドユーザー用回線であることが多い。
したがって、逆引きFQDNのないIPアドレスからのSMTPアクセスは、少しの例外を除いて拒否してもかまいません。
S25Rは、SMTP接続を拒否するためのルールです。しかし、実際に拒否してしまうと、不都合なこともあります。S25Rに引っかかったサーバーからの送信が、必ずしもスパムというわけではないので、ホワイトリスト以外の救済策がないと、かなり極端な運用方法になってしまいます。
そこでGreylistを併用します。Greylistingとは、SMTP接続をしてきた相手サーバーに対しTemporary Error(450)の応答を返し、リトライを促す運用方法です。
これは相手がまともなサーバーなら一定時間後にきちんとリトライをしてくれるが、スパム用のサーバーならすぐに諦めてしまうことも多い、という経験則に基づいています。これをS25Rに引っかかった相手サーバーに対してのみ適用します。
これにより、次のような運用方法が実現します。
S25RにかかったサーバーのみをGreylistingすることにより、善良と思われるサーバーからのメールは遅延せず、また、仮にS25Rにかかったとしても、その後のリトライが通常通りなら、一定時間の遅延のみで受け取ることができます。
【 Greylisting(グレイリスティング)方式 】
Greylisting方式は、無条件にメールの配送を拒否するBlacklist(ブラックリスト)、無条件に配送を許可するWhitelist(ホワイトリスト)に加えて、判断保留用のGreylist(グレイリスト)を用いる方式です。
この方式では、初めてメールを送信してくるサーバに対して、Temporary Error(450)の応答を返してリトライを促し、一時的な配送拒否を行うとともにGreylistに登録します。
電子メールサーバの規格では、一時的な拒否の際には、ある程度時間を空けて再配送する事が求められており、規格に沿ったメールサーバソフトであれば一般的に15分前後の間を置いて再配送を試みるはずです。
こうして、Greylistに載っているサーバが、通常のメールサーバーであれば、5分以上間を空けて再度メールの送信を試みます。その場合に、初めてメールの配送を許可します。
迷惑メールの送信に利用されるツールは、短時間に大量のメールを捌くため、一時拒否に対して再配送を試みなかったり、一時拒否されると即座に再配送を行うような動きをするものが多く、こうしたメールの大量送信用ツールから送られる迷惑メールを受信前に遮断することが可能です。
また、頻繁にメールをやりとりするメールサーバは、自動的にホワイトリストに登録され、一定期間(現状は35日)は無条件で配送が許可されるようになります。
【 OP25B 】(Outbound Port 25 Blocking)
ネットワークの境界にあるルータなどの機器で、ネットワーク内から外部のコンピュータのTCPポート25番への通信を禁止すること。
ISPが自社網内のユーザが撒き散らす迷惑メールを封じ込めることを目的として、自社網の動的IPアドレスのホストが網外の SMTPサーバに向けて25番ポートからメールを直送する処理を規制する技術である。
25番ポートはメールの送信に使うSMTPが利用するポートで、これを塞ぐことでメールの送信ができなくなる。
会員がISPのメールサーバでスパムメールを送信しようとする場合は、これを個別に遮断したり会員を退会処分にしたりすることができるが、外部のメールサーバを利用されるとこうした措置を取ることができない。そこで、ネットワークの境界で外部のSMTPサーバへの通信を遮断することにより、会員のコンピュータが外部のメールサーバを利用してスパムメールなどを送ることを根こそぎ防ぐことができる。あくまで外部サーバへの通信を遮断するだけで自ネットワーク内にあるメールサーバへの通信は可能なため、ISPのメールサーバを利用した通常のメールの送受信は影響を受けない。
www上のドキュメント(ウェブページ)にアクセスするには、URLを直接指定する、または他のウェブページからハイパーリンクをたどる必要があります。
文書の所在であるURLを指定すると、まずはDNSを通じてウェブサーバーが指定され、HTTPスキームを使用してアクセスされます。
次にブラウザから指定(リクエスト)された文書とそれを補完する要素(CSS、画像、スクリプト言語等)のデータがウェブサーバーからウェブブラウザに送信され、視覚的に表示されます。
指定されたURLがサーバーサイドで動作するプログラムの場合、ウェブサーバー上で一連の処理を終えた結果がウェブブラウザに送信され、表示されることになります。
通信速度が十分でない場合、読み込む文書や画像のファイルサイズが大きい場合やプログラムの処理が複雑な場合は、ウェブブラウザがウェブサーバーにリクエストをしてから表示されるまで時間がかかる場合があり、これを一般に「重たい」と表現します。
【 cookie 】
cookieは、ブラウザに一時的に保存される情報で、Webページを取得する際にサーバー側からヘッダー情報として送信される。また、サーバーはそのクッキー情報にアクセスすることができる。最終訪問日やアクセス数などの情報以外にも、PHPではセッションIDや、自動ログインの仕組みに使用される。
ひとつのCookie機能が記録できる情報は、データが最大4096バイトまで、エントリーが最大300までとなっている。ひとつのコンピュータに対して同じサーバーが付与することのできるCookieは20個までである。20個それぞれに有効期限を設けることが可能である。
【 CGI 】(Common Gateway Interface)
ウェブサーバ上でユーザプログラムを動作させるための仕組み。
CGIプログラムは、ブラウザ等から得られた情報などをもとにプログラムを実行して、再びブラウザに返すという働きをします。
【 Web ビーコン 】
Webビーコンとは、WebページやHTML形式の電子メールに埋め込まれた非常に小さなサイズの画像データのこと。Webページを閲覧したり、メールをプレビューしたりすると、画像ファイルを取得するためにWebサーバーへのアクセスが発生するため、そのサーバーでアクセスが把握できる。
【 セッションID 】
セッションを簡単に説明すると「サーバ内に情報を保存し、複数ページ間で共有する」仕組みのことです。
Webアプリケーションを使ってセッションを利用すると、自動的にセッションIDと呼ばれる一意のIDが発行されます。このセッションIDはセッションに登録されたデータに紐付けられるとともに、クッキーに保存されます。セッションIDが登録されたブラウザは、Webアプリケーションにアクセスする際にセッションIDを送信するため、サーバ側ではこのIDを確認することで一連のアクセスであることが認識できるようになります。
【 HTTPS 】
httpでやり取りされるデータは第三者が閲覧したり改ざんしたりすることができます。そこでデータを暗号化し、第三者から保護する目的でhttpsが開発されました。
httpsはSSL/TSLという技術で送受信される情報に鍵をかけ、サーバーとクライアントだけに配布します。そのために必要なのが「SSLサーバー証明書(SSL証明書)」。SSL証明書を発行し、サイトのサーバーにインストールすることでhttps化が行えます。
クライアントとウェブサーバの間では、下記の手順1~4および図 1 のようなやり取りが行われます。
FTP(File Transfer Protocol)は、インターネット上のファイルを送受信するためのプロトコル。
FTPサーバーに接続することで、特定の場所にあるファイルをダウンロードしたり、特定の場所にファイルをアップロードしたりすることができる。
FTPの特徴は,転送するファイルに制約がないことで,テキストデータもバイナリデータも元のまま転送できる。
サーバで提供するサービスの中で 2 つのポートを標準で用いるサービスは、FTP だけである。FTP では、制御用のポートと実際のデータを転送するポートの 2 つを用いる。クライアントから FTP サーバに対して要求があった場合は、21番ポートの制御用のポートでTCPコネクションをオープンしコマンドのやり取りを行い、その後、データ転送用のポートを用いてファイル転送を行う。標準のサーバでは、制御用ポートに 21 番ポートを割り当て、データ転送用ポートに 20 番を割り当てることになっている。これらのポートは Well-known ポート含まれ、設定をむやみに変えてしまうことは原則として許可されていない。 FTP によるデータ転送モードには、2 種類存在する。データ転送用コネクションをどちらからオープンするかで種類がある。
FTPでは、データ転送用コネクションが確立されるのが必ずしもFTPサーバとFTPコマンドを起動した端末との間である必要はない。他の2つの端末間でのファイル転送を別の端末のFTPにて行うことも可能(1つのFTPクライアントから同時に2つのFTPサーバに接続し、2つのFTPサーバ間でファイルを転送する場合に、片方のサーバをPORTでオープンし、もう片方をPASVでオープンする)。ただし、そのためにはその2端末に適応したユーザであることと、送信元ファイルと受信先ディレクトリへのアクセス権が必要となる。その際、自端末と他の2端末の間に制御コネクションが開かれ、他の2端末間にデータ転送用コネクションが開かれることとなる。これを第三者転送と言う。
WWWでは、インターネット上のWWWサーバーから情報を閲覧することができるが、ほしい情報のWWWサーバーのURLがわからなければ、情報にたどり着くことができない。
そのため、WWWサーバーにどのような情報が保存されているのかキーワードなどで検索するための仕組みが必要である。
インターネット上の多くのWWWサーバーの情報を入手しておき、キーワードなどで検索し、キーワードに一致するWWWサーバーのURLを教えてくれる仕組みが検索エンジンである。
検索エンジンの種類には、ディレクトリ型・ロボット型・全文検索型の3つがある。
【 ウェブ スクレイピング 】
WebサイトからWebページのHTMLデータを収集して、特定のデータを抽出、整形し直すことである。
ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。ウェブ・クローラーあるいはウェブ・スパイダーとも呼ばれる。
www.it-shikaku.jp