English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Простые методы detections текстового типа с использованием файла заголовка и библиотеки cchardet

Этот пример описывает метод простого обнаружения типа текста на Python. Делимся с вами для вашего参考, подробности см. ниже:

1. Na podstawie nagłówka pliku.

# Czy to plik UTF8 z głową BOM?
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2. Использование библиотеки cchardet.

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{"encoding": "UTF-8", "confidence": 0.9900000095367432}

Читатели, интересующиеся дополнительной информацией о Python, могут ознакомиться с темами на нашем сайте: «Сборник навыков работы с файлами и каталогами в Python», «Сборник навыков работы с текстовыми файлами в Python», «Сборник навыков работы с URL в Python», «Сборник навыков работы с изображениями в Python», «Учебник по структурам данных и алгоритмам в Python», «Сборник навыков работы с Socket в Python», «Сборник навыков использования функций в Python», «Сборник навыков работы со строками в Python» и «Классическое учебное пособие по началу и продвижению в Python»

Надеюсь, что информация, предоставленная в этой статье, поможет вам в программировании на Python.

Декларация: содержание статьи предоставлено из интернета, авторские права принадлежат их владельцам, материалы предоставлены пользователями интернета в качестве добровольного вклада, сайт не имеет права собственности, не был отредактирован вручную и не несет ответственности за соответствующие юридические вопросы. Если вы обнаружите контент,涉嫌侵犯版权, пожалуйста, отправьте письмо по адресу: notice#oldtoolbag.com (при отправке письма, пожалуйста, замените # на @) для отчета и предоставьте соответствующие доказательства. В случае подтверждения факта нарушения авторских прав, сайт немедленно удалит涉嫌侵权的内容.

Основной учебник
Давай полюбим это