パース(Parse)とは?

- web系知識メモ

Parseとは?

よく解説記事などで「HTMLをParseして...」や「HTMLパーサー」などの用語を目にしますが、よくわからなかったのでこちらの記事をもとにまとめます。

Parserについて

Parseとは「文法・構文を解剖する」という意味の単語であるため、Parserは「文法・構文を解剖するモノ、人」となります。 パーサーはHTMLだけを対象とするものではなく、Javascript、XMLに対しても利用することがあるようです。

HTMLパーサーについて

ということはHTMLパーサーは「HTMLを文法的、構文的に解剖するモノ」となります。ここでHTMLデータが画面に描画されるまでを以下に示します。 ざっくりいうと、「入手したデータをHTMLの文法に基づいて要素などに分割し、そのデータを整理して、画面に描画しているようです。」 詳細なことは後日まとめようと思いますが、こちらの記事にある通りです。

まとめ

  • parseは「文法・構文を解析する」という意味の単語
  • HTMLパーサーは「HTMLデータをレンダリングするために分析し、要素に区分けしている」