Question 1

Shift_JISやEUC-JPのコードも表示できますか？

Accepted Answer

現在はUnicode（UTF-8／UTF-16）ベースの表示・変換のみに対応しています。ブラウザのJavaScript標準APIがUnicode前提のため、Shift_JISやEUC-JPへのエンコード変換は実装していません。これらが必要な場合は、Windows標準のメモ帳やVSCodeで保存時にエンコード切り替えを行う、もしくはコマンドラインのnkf・iconvを使うのが確実です。

Question 2

絵文字も正しく扱えますか？

Accepted Answer

はい、絵文字を含むすべてのUnicode文字に対応しています。サロゲートペア（U+10000以降）は2つのコードユニットに分割される代わりに、本ツールでは結合済みコードポイント（U+1F600など）として正しく1行で表示します。家族絵文字や肌色バリエーションなど結合文字を含む絵文字は、構成要素ごとに行が分かれて表示されるため、内部構造を学習する用途にも便利です。

Question 3

URLエンコードとUnicodeエスケープの違いは？

Accepted Answer

URLエンコードはUTF-8バイト列を%XX形式に変換する仕組みで、URLやAPIのクエリ文字列向け。Unicodeエスケープは\uXXXX形式でUTF-16コードユニットを表現し、JavaScript文字列やJSON値に埋め込むためのものです。同じ「日」でもURLエンコードは%E6%97%A5、Unicodeエスケープは日と異なる表記になります。

Question 4

文字化けの原因はどう調べればいい？

Accepted Answer

文字化けしたテキストを「文字コード一覧」で表示し、化けている文字のコードポイントが「U+FFFD（REPLACEMENT CHARACTER）」になっていればエンコード不一致が原因です。逆に元の文字が想定外のコードポイント（例えばU+200E：左から右へのマーク）になっていれば、不可視制御文字の混入が疑われます。

Question 5

HTMLで「&#x30DD;」のような表記はいつ使う？

Accepted Answer

エディタの文字コード設定が不安定な場合や、海外サーバーで日本語が化けやすい環境で、確実に文字を表示したいときに使います。HTMLメール、レガシーCMS、SVG内のテキストなど。一度数値参照に変換しておけば、ASCII範囲のバイトしか含まないため、転送経路でのエンコード事故を回避できます。

Question 6

16進ダンプは何の役に立ちますか？

Accepted Answer

通信プロトコル解析やバイナリファイル調査で、テキストの実バイト列を確認したい場面で活躍します。たとえば「ポ」がUTF-8でE3 83 9Dの3バイト、「Ａ」（全角A）がEF BC A1の3バイトといったように、ASCIIと多バイト文字の違いが視覚的に把握できます。

Question 7

入力したデータはサーバーに送信されますか？

Accepted Answer

いいえ、すべての処理はブラウザ上で完結します。コードや個人情報を含む文字列を貼り付けた場合でも、外部サーバーに送信されることは一切ありません。

機能	出力例	用途
文字コード一覧	各文字のUnicode・UTF-8バイト列・文字名・カテゴリ	文字化け調査・サロゲートペア解析
URLエンコード	%E3%83%9D%E3%83%81 のようなパーセントエンコード	URLパラメータ生成・APIリクエスト
Unicodeエスケープ	ポチットのような\uXXXX形式	JavaScript文字列・JSON値・正規表現
HTML数値参照	ポチのような&#x形式	HTML・XML・SVGの文字埋め込み
16進ダンプ	E3 83 9D E3 83 81 のようなバイト列	通信プロトコル・バイナリ解析

文字コード変換・判定ツール

文字コード変換・判定ツールの概要・基礎知識

主な機能と用途

使い方の流れ

こんな場面で使う

使う前に知っておきたい注意点

用語の補足

よくある質問