Fora je verovatno u sledecem - kad Notepad otvara fajl on nema pojma koji je encoding koristen - da li je ASCII, UTF-16, UTF-8 da li je big-endian ili little-endian. Neki Unicode dokumenti imaju BOM zaglavlje koje govori koji je encoding. Medjutim nemaju svi. I onda notepad, posto ne zna sa sigurnoscu sta je primeni neku heuristiku. Npr. ako ga otvori kao UTF-16 i dokument ima 99% karaktera iz iste jezicke skupine onda proceni da je to to.
http://unicode.org/faq/utf_bom.html