データ(ファイル)の形式っていったい何なの?

この文書は、コンピュータ初心者にコンピュータのデータの実体はどんなものなのかを 理解してもらい、コンピュータを単なる文房具の代わりとして使うのではなく 一歩進んだ使い方ができるようになるためのものです。

この文書はまだ制作途中です。とりあえずの形にはなっていますが、 まだ増やす予定ですのでご期待下さい。

1. はじめに --- データの形式は存在しない。ただ解釈の種類が存在する。

コンピュータで扱うデータには、テキストだとかワード文書だとか JPEG 形式の 画像だとか、様々な形式があります。Mac の場合には、GIF 形式なんだけれども Photoshop ドキュメントでもある、というようなファイルが存在し、 事情はさらに複雑になっています。(ここでは、「ファイル」と「データ」を 同じような意味で使っています。)

しかし、結論から言ってしまうと、コンピュータで扱うデータはすべて、 0〜255 の範囲の整数が並んだものにすぎないのです。つまり、 データそのものに「形式」があるのではなくて、「形式」とは データをどのように解釈するかという方法のことなのです。

これは、コンピュータ上のデータがコンピュータ以外の現実のデータとは 異なっている重要な点です。この性質のおかげで、 どんな種類のデータでも同じようにファイルとしてディスクに保存することができ、 ファイル圧縮ソフトはどんな種類のデータでも圧縮することができ、 そして、ひとつのデータをいろんなソフトで使うことができるのです。 さらには、ひとつのデータをいろんなやり方で解釈してやることによって、 コンピュータならではの柔軟なデータ処理が可能になるのです。

以下で、データとはもともとどういうもので、それをどのように解釈すると テキストだとか映像だとかに見えてくるのか、ということを説明します。

2. データとは何か --- 解釈を加える前の生の状態を見てみよう
3. バイトの解釈のやり方 --- 命令としての解釈と、数値としての解釈
4. 最も基本的な解釈 --- テキストデータ
5. テキストの応用範囲は広い!
6. エディタ --- テキストファイルを扱う
7. バイナリファイルとはなにか --- テキスト以外のファイルのことである
8. 16 進ダンプとバイナリエディタ
9. 画像ファイル --- 独自のフォーマットを作ってみよう
10. 圧縮 --- 現代の魔術か?
11. C言語の世界におけるテキストとバイナリ
12. 電子メールで「バイナリ」を送れないってどういう意味?
13. 電子メールで「バイナリ」を送るためのツール集
14.


久保田智広ホームページに戻る


久保田智広にメールを出す
感想、提案、情報提供、ファンレター、恋文、相互リンクの申し出、などなど大歓迎

久保田のページはすべてリンク自由です。