サクラエディタの文字コードの自動誤判別

サクラエディタ(2.3.2.0)では開いたファイルの文字コードを自動判別する機能があるのだが、
Shift_JISで書かれたテキストファイルをUTF-8と見誤ってしまう現象に出会った。
最近はほとんど使うことが無くなったのだが、以前サクラエディタはよく使っていた。
しかし、このような誤判定には幸い今まで出くわしたことがなかったので、
とりあえずメモメモ。

起きたのは普通のテキストファイル。拡張子がtxtで内容はShift_JISの素のテキストである。
このファイルをサクラエディタで開こうとすると、
「うちはこれをUTF-8で開くつもりだけど、前に開いた時はShift_JISで開いたんだ。どっちで開けばいいの?」
とのダイアログが出現。
もちろんファイルにUTF-8のコードは入っていないし、内容は基本的に日本語の文章である。

判定を誤る原因となりそうなものを探す……
まさか、そんなことはないよね?というレベルのものを見出し一時的に削除し、一旦エディタを終了。
次に開くと見事に正しく判定されて素直に起動した。

問題の場所は以下のようなもの。

...snip
<!DOCTYPE html>
<html>
 <head>
  <meta charset="utf-8">
...snip

ここだけ見ると、HTMLに見えるが、ファイルの内容的にはHTML形式ではなく素のテキスト文書であり、
文章の途中でHTMLの一部を挿入しているだけである。
charset="utf-8"ではあっても、この後のHTMLの日本語部分はもちろんShift_JISで書いてある。
ところが、ここに示している最後の行を試しに、

  <meta charset="">

としてやって保存、再起動すると何のダイアログも出ることなくShift_JIS文書として開かれた。

つまりサクラエディタは、文字コードをきちんと調べたりすることで判別せずに、
この問題の部分に書いてある内容の意味を判断材料に使ったというのが、原因のようである。
示した部分より前にも日本語文章は書かれてあるので、
この部分に至るまで全て英数字でUTF-8と区別がつかない、なんてことではない。
また、これより前の部分にHTMLと混同するような内容は無いし、
文書全体としてもHTMLとは全く異なる構造である。
ファイル名もHTMLをにおわせるようなものは無い。

唯一、もしかしたらと思う点としては、
このcharsetの行はファイル先頭から700バイト強の辺りに存在していることであろうか。
先頭のどれくらいの部分を見ているのか分からないが、
ファイルの頭から1KiB分くらいを使っていて、さらにそれを誤った方法で判別に使っているのなら、
つまり、件の部分よりも前の部分の文章量が多ければこの誤判定は無かったのかもしれない。
それにしても、例えばfoo.htmlを開こうとするとかなら、それもありえるかもとは思うものの、
さすがに今回の動作は妙すぎるなあ。