file_read_codePage
指定したファイルで使用されている文字コードを判別し、それを表す数値を返します
定義¶
名前空間: Alice.IO
アセンブリ: Losetta.Runtime.dll
ソースコード: Alice.IO.cs
file_read_codePage(string,bool)¶
指定したファイルをファイルシステムまたは現在のパッケージから読み取り、ファイルで使用されている文字コードを判別し、文字コードのコードページを表す数値を返します。
namespace Alice.IO;
public number file_read_codePage(string path, bool fromPackage = false);
| 引数 | |
|---|---|
path |
読み取るファイルへのパス |
fromPackage |
ファイルを現在のパッケージから読み取る場合はtrue、ファイルシステムから読み取る場合はfalse。既定値はfalseです。 |
| 戻り値 | |
|---|---|
number |
文字コードのコードページを表す数値 |
| 対応 | |
|---|---|
| AliceScript | 3.0、4 |
| AliceSister | 3.0、4 |
| Losetta | 0.10、0.11 |
説明¶
sourceやdestinationには、相対パスと絶対パスのどちらを指定することもできます。
相対パスを指定した場合、カレントディレクトリからの相対パスとして解釈します。
パスの大文字と小文字の区別は、環境およびファイルシステムに依存します。たとえば、NTFSでは大文字と小文字は区別されませんが、LFSでは大文字と小文字が区別されます。
この関数は、ファイルを開き、ファイル内のデータをすべて読み取った後ファイルを閉じて結果を返します。
この関数は、ReadJEncを使用してファイルで使用されている文字コードを検出します。また、Unicodeまたは文字コードを認識できない場合は常に0が返ることにご注意ください。 文字コードと対応するコードページについては、以下を参照してください。 この関数は以下の表のコードページを返します。
| 規格名 | 言語 | 文字コード名 | コードページ |
|---|---|---|---|
| ASCII | 英語 | ASCII | 0 |
| ANSI | 西ヨーロッパ諸語 | ANSI1252 | 1252 |
| ISO-2022-JP MS拡張 | 日本語 | JIS | 50221 |
| ISO-2022-JP Allow 1byte Kana | 日本語 | JIS50222 | 50222 |
| Shift-JIS | 日本語 | ShiftJIS | 932 |
| EUC-JP | 日本語 | EUCJP | 51932 |
| BIG5 | 繁体字中国語 | Big5 | 950 |
| x-Chinese-CNS | 繫体字中国語 | EUC-TW | 20000 |
| GB18030 | 簡体字中国語 | GB18030 | 54936 |
| EUC-CN | 簡体字中国語 | GB18030 | 54936 |
| ISO-2022-KR | 韓国語 | ISO-KR | 50225 |
| KS_C_5601-1987 | 韓国語 | UHC | 949 |
| EUC-KR | 韓国語 | UHC | 949 |
| ISO-8859-2 | 中央ヨーロッパ諸語(チェコ語など) | CP1250 | 1250 |
| ISO-8859-7 | ギリシャ語 | CP1253 | 1253 |
| ISO-8859-9 | トルコ語 | CP1254 | 1254 |
| ISO-8859-8 | ヘブライ語 | CP1255 | 1255 |
| ISO-8859-13 | バルト諸語 | CP1257 | 1257 |
| Windows1251 | キリル諸語(ロシア語など) | CP1251 | 1251 |
| Windows1256 | アラビア語 | CP1256 | 1256 |
| Windows1258 | ベトナム語 | CP1258 | 1258 |
| TIS-620/WIndows874 | タイ語 | TIS-620 | 874 |
また、場合によっては以下の文字コード名またはコードページを返します。
| 文字コード名 | コードページ | 理由 |
|---|---|---|
| JIS破損 | -50221 | JISのように見えるがデコード不能な場所あり |
| EUC補漢 | 20932 | EUC補助漢字を含むため、MS-CP20932をデコードに使用 |
| 読込不能 | 0 | 読み込みに失敗 |
| 空File | 0 | 空のファイル |
| 巨大File | 0 | ファイルサイズが2.147483647GBより大きい |
| $BINARY | 0 | バイナリ |
| $JavaBin | -65001 | Javaバイトコード |
| $WinExec | 0 | Windows実行ファイル |
| $WinLnk | 0 | WIndowsショートカットファイル |
| 0 | PDFファイル | |
| $ZIP | 0 | ZIP圧縮されたファイル |
| $GZIP | 0 | GZIP圧縮されたファイル |
| $7ZIP | 0 | 7ZIP圧縮されたファイル |
| $RAR | 0 | RAR圧縮されたファイル |
| $CAB | 0 | キャビネット(Cab)ファイル |
| $BZIP2 | 0 | BZIP2圧縮されたファイル |
| $Z-LZW | 0 | Z(compress)圧縮されたファイル |
| %BMP | 0 | ビットマップ画像ファイル |
| %GIF | 0 | GIF画像ファイル |
| %JPEG | 0 | JPEG画像ファイル |
| %PNG | 0 | PNG画像ファイル |
| %TIFF | 0 | TIFF画像ファイル |
| %ICON | 0 | Windowsアイコンファイル |
例¶
次の例では、test.txtの文字コードを判別し、コードページで表示します。