text-processing

Я написал сценарий Ruby, который читает файл (File.read()), содержащий символы unicode, и он отлично работает из командной строки. Однако, когда я пытаюсь поместить его в рабочий процесс Automator (Mac OS X), я получаю эту ошибку; 2009-12-23 17:55:15 -0500: /Users/jeffreyaylesworth/bin/symbols:19:in `split...

В настоящее время я работаю над проектом, в котором хочу извлечь эмоции из текста. Поскольку я использую conceptnet5 (семантическую сеть), я не могу, однако, просто приставлять слова в предложении, которое содержит слово отрицания, поскольку эти слова просто не будут отображаться в API conceptnet5. Вот приме...

Мой запрос string = 'Alligator in water', где in - стоп-слово. Как я могу удалить его, чтобы получить stop_remove = 'Alligator water' в качестве вывода. Я пробовал его с ismember, но он возвращает целое значение для соответствующего слова, Я хочу получить оставшиеся слова в качестве вывода. in это просто при...

Например, задана строка: "Боб отправился на рыбалку со своим другом Джимом Смитом." Боб и Джим Смит-это имена, но Боб и Смит-это слова. Если бы они не были прописными, было бы меньше указаний на это вне нашего знания предложения. Существуют ли хорошо известные алгоритмы обнаружения присутствия имен, по кра...

У меня есть ~ 23000 строка SQL дамп, содержащий несколько баз данных стоит данных. Мне нужно извлечь определенный раздел этого файла (т. е. данные для одной базы данных) и поместить его в новый файл. Я знаю как начальные, так и конечные номера строк данных, которые мне нужны. кто-нибудь знает команду Unix (и...

у меня есть файл, как показано ниже: line1 line2 line3 и я хочу к вам: prefixline1 prefixline2 prefixline3 я мог бы написать сценарий Ruby, но лучше, если мне это не нужно. prefix содержит /. Это путь, /opt/workdir/ например....

Как преобразовать весь текст в Vim в нижний регистр? Это вообще возможно?...

Я хочу обновить большое количество исходных файлов C++ с дополнительной директивой include перед любым существующим #includes. Для такого рода задач я обычно использую небольшой скрипт bash с sed для перезаписи файла. Как заставить sed заменить только первое вхождение строки в файле, а не заменять каждое вх...

FILE: hello world foo bar как можно, когда удалить все пустые новые строки в этом FILE? вывод команды: FILE: hello world foo bar ...

у меня есть переменная Bash,$word, что иногда является словом или предложением, например: word="tiger" или: word="This is a sentence." как я могу сделать новую переменную Bash, которая равна только первой букве, найденной в переменной? Например, выше было бы: echo $firstletter t или: echo $firstlett...