utf-8 — все вопросы

4ответа
10 голосов
В чем разница между префиксом u '' и unicode () в python?
В чем разница между префиксом u'' и unicode() # -*- coding: utf-8 -*- print u'上午' # this works print unicode('上午', errors='ignore') # this works but print out nothing print unicode('上午') # error
2ответа
10 голосов
Как сохранить файл как UTF-8 из Perl?
Я пытаюсь создать /сохранить HTML-файлы в Perl в UTF-8, но пока ничего, что я сделал, не работает. предыдущий ответ здесь, на SO , сказал использовать binmode, поэтому Я попробовал это. Вот мой код
4ответа
10 голосов
Как правильно вставить символы utf-8 в таблицу MySQL, используя python
Я очень смущен и озадачен тем, как я храню строки с необычными символами (для тех, кто привык иметь дело с набором символов английского языка в Великобритании). Вот мой пример. У меня есть это
2ответа
10 голосов
Конвертировать Javascript UTF-8 в ASCII (например, Iconv ('UTF-8', 'ASCII //TRANSLIT', $ string) в PHP)
Мне интересно, как можно «перевести» символы в UTF-8 в ближайший эквивалент ASCII, используя Javascript, как это делает Iconv в PHP. Пример: ü становится u ó становится o Я бы предпочел не
1ответ
10 голосов
Конвертировать юникод со строкой utf-8 в качестве содержимого в str
Я использую pyquery для анализа страницы: dom = PyQuery('http://zh.wikipedia.org/w/index.php', {'title': 'CSS', 'printable': 'yes', 'variant': 'zh-cn'}) content = dom('#mw-content-text > p').eq
6ответов
10 голосов
Динамически генерирующие Ge'ez Unicodes
Привет. Если вы посмотрите на изображение выше, вы увидите набор очень странных символов, отображаемых вместе с некоторыми латинскими символами. Странные - эритрейские персонажи. Это персонажи, к
3ответа
11 голосов
текст в pdf с кодировкой utf8 (альтернатива a2ps)
Программа a2ps не поддерживает utf-8. По крайней мере, моя версия делает только поддерживать кодировки латинского X: a2ps --list=encoding Версия: GNU a2ps 4.14 Как я могу преобразовать про
2ответа
11 голосов
читать ресурсный пакет как UTF-8. Метод getString (), кажется, меняет кодировку на ISO-8859
У меня есть почетное задание изменить кодировку нашего полного рабочего пространства, проектов и файлов на кодировку UTF-8. У нас есть несколько Resourcebundles, которые используются для кодирования
4ответа
11 голосов
Получение python для печати в UTF8 на Windows XP с консоли
Я хотел бы настроить мою консоль в Windows XP для поддержки UTF8, чтобы python обнаруживал это и работал с ним. Пока что мои попытки: C:\Documents and Settings\Philippe>C:\Python25\python.ex
2ответа
11 голосов
Как найти код символа специального символа в моем текстовом редакторе?
При вставке текста из внешних источников в текстовый редактор (например, TextMate или Sublime Text 2) распространенной проблемой является то, что специальные символы также часто вставляются. Некотор
2ответа
11 голосов
Проблема с IntelliJ IDEA
В моем ноутбуке произошел сбой жесткого диска, и мне пришлось переустановить IntelliJ и windows на новый жесткий диск. На моем старом диске я смог печатать (system.out.println) иностранные языки в к
1ответ
11 голосов
Rails, Heroku и неверная последовательность байтов в ошибке UTF-8
У меня есть очередь текстовых сообщений в Redis. Допустим, сообщение в Redis выглядит примерно так: "niño" (найдите нестандартный символ). Приложение rails отображает очередь сообщений. Ког
2ответа
12 голосов
Использование str_word_count для текстов UTF8
У меня есть этот текст: $text = "Başka, küskün otomobil kaçtı buraya küskün otomobil neden kaçtı kaçtı buraya, oraya KISMEN @here #there J.J.Johanson hep. Danny:Where is mom?
2ответа
12 голосов
Как преобразовать JavaScript код записи Unicode в UTF-8?
Существует ли инструмент командной строки или онлайн-сервис, который может конвертировать код нотации javascript unicode в utf-8? например. Я получил этот код JSON, но его трудно редактировать в
4ответа
12 голосов
Не могу войти в Умлаутс в Ruby 1.9.3 IRB
Я испытываю очень странное поведение в IRB Ruby 1.9.3 с Mac OS 10.7.3 Когда я пытаюсь ввести Umlaut, он экранируется в приглашении и выглядит так (я ввел "ü" на клавиатуре) irb(main):001:0> "\U
5ответов
12 голосов
Реализуйте функцию, чтобы проверить, соответствует ли массив строк /байтов формату utf-8
Я пытаюсь решить этот вопрос интервью.    После того, как дано четкое определение формата UTF-8. например: 1 байт:   0b0xxxxxxx 2-байта: .... Просили написать функцию для проверки   вход действит
3ответа
12 голосов
Hibernate /JPA import.sql utf8 символов поврежден
Я использую import.sql для записи своих данных разработки в БД. Я использую MySQL Server 5.5, и мой файл persistence.xml находится здесь: <?xml version="1.0" encoding="UTF-8"?> <persisten
1ответ
12 голосов
UnicodeDecodeError в Python при чтении файла, как игнорировать ошибку и перейти к следующей строке?
Я должен прочитать текстовый файл в Python. Кодировка файла: file -bi test.csv text/plain; charset=us-ascii Это сторонний файл, и я получаю новый каждый день, поэтому я бы не стал его менять.
1ответ
12 голосов
Невероятный символ для кодировки ASCII, но мои файлы в UTF-8
У меня следующая ошибка при запуске моего скрипта ant: [javac] /****/TextUtils.java:25: error: unmappable character for encoding ASCII Но этот файл закодирован в UTF-8, если я выполню команду i
2ответа
13 голосов
Определить, был ли PCRE собран без параметров конфигурации --enable-unicode-properties или --enable-utf8
У меня есть библиотека PHP, которая использует ряд регулярных выражений с выражениями \P для многобайтовых строк, например . ((((?:\P{M}\p{M}*)+?)|(\'[^\']*\')|(\"[^\"]*\"))!)?\$?([a-z]{1,3})\$?(\d
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132