Forth • Ответить

...

Forth-FAQ

WingLion.Ru

Список форумов » Форт Системы (Forth Systems) » SP-Forth

Часовой пояс: UTC + 3 часа [ Летнее время ]

Перенос строк в файле и SPF.

Модераторы: Модераторы

Ответить

Имя пользователя:

Заголовок:

Текст сообщения:
Введите текст вашего сообщения. Длина сообщения в символах не более: 60000.

Размер шрифта:

	Цвет шрифта
[quote="mOleg"][quote="in4"]А, кстати, как можно решить такие проблемы?[/quote] во-первых, можно искать только один символ 0x0D а не последовательность из двух. во-вторых, можно грузить в память файл целиком (памяти для этого сейчас хватает) ограничение, слишком большие файлы не будут загружаться (слишком большие, это больше ~1.5GB на файл) можно совместить решения, большие файлы читать построчно (или поблочно) а маленькие целиком (так сделано в форке)[/quote]

Настройки:

BBCode ВКЛЮЧЕН

[img] ВЫКЛЮЧЕН

[flash] ВЫКЛЮЧЕН

[url] ВКЛЮЧЕН

Смайлики ВЫКЛЮЧЕНЫ

	Отключить в этом сообщении BBCode
	Не преобразовывать адреса URL в ссылки

Вопрос

Теперь гостю придется вводить здесь пароль. Не от своей учетной записи, а ПАРОЛЬ ДЛЯ ГОСТЯ, получить который можно после регистрации на форуме через ЛС.:
Этот вопрос предназначен для выявления и предотвращения автоматических регистраций.

Обзор темы - Перенос строк в файле и SPF.

Автор

Сообщение

WingLion

Заголовок сообщения:

Можно и мелкими блоками читать, просто фиксировать, когда конец строки достигнут при чтении, а когда нет. Если нет, следующую считанную порцию приклеивать к остатку предыдущей.
А остатком считать "слово, которое закончилось не пробелом, концом буфера" (если на конце был пробел - остаток - пустая строка)

Добавлено: Ср янв 27, 2010 19:11

mOleg

Заголовок сообщения:

in4 писал(а):

А, кстати, как можно решить такие проблемы?

во-первых, можно искать только один символ 0x0D а не последовательность из двух.
во-вторых, можно грузить в память файл целиком (памяти для этого сейчас хватает) ограничение, слишком большие файлы не будут загружаться (слишком большие, это больше ~1.5GB на файл)
можно совместить решения, большие файлы читать построчно (или поблочно) а маленькие целиком (так сделано в форке)

Добавлено: Ср янв 27, 2010 13:17

вопрос

Заголовок сообщения:

В начале файла обзательное слово о типе CR и без него вообоще файл не загружать

впрочем, если учесть, что CR в одном типе состоит из одного символа, а в другом - из двух = можно определять автоматически

Добавлено: Ср янв 27, 2010 01:25

in4

Заголовок сообщения:

А, кстати, как можно решить такие проблемы?
Ведь, как я понимаю, такая же проблема будет если файл читать блоками (используя BLOCK) и строка или число попадет на границу?
И при страничной организации (тоже через блоки) виртуальной памяти снова это же будет?
Интересуют красивые решения.

Добавлено: Ср янв 27, 2010 00:58

mOleg

Заголовок сообщения:

ээм, с проблемой разобрались уже.
дело в том, что файл в СПФе грузится не целиком, а построчно, с помощью операции REFILL
эта самая REFILL ищет последовательность 0x0D 0x0A и обрезает строку в буфере по эту последовательность.
соответственно, если последовательность не встречается, а длина файла больше буфера, то на конце может воозникнуть ошибка, так как слово, находящееся на границе буфера будет разрезано.

Добавлено: Вт янв 26, 2010 18:44

WingLion

Заголовок сообщения:

В виндовсе в конец строки надо вписывать 0D0A, в юниксе - только 0D (или только 0A, не уверен, как правильно).
А программе должно быть пофиг, где она работает, и вывод конца строки должен обрабатываться автоматом.
Вывели строку, выводящее слово само добавило нужный конец строки, а не программисту об этом репу чесать.

p.s. А у меня проблем нет...

Добавлено: Пн ноя 17, 2008 19:21

seu

Заголовок сообщения:

WingLion
Не совсем понял. А какие с этим проблемы?

Добавлено: Пн ноя 17, 2008 12:29

WingLion

Заголовок сообщения:

А при выводе файлов - программисту мудохаться с определением того, какая система, какой конец строки вписывать в конец?

Добавлено: Вс ноя 16, 2008 08:16

seu

Заголовок сообщения:

chess писал(а):

seu писал(а):

chess
Странное тут то, что разделителем должен являться любой байт, числовое значение которого меньше 33.

Тут причина в том, что при чтении в буфер разбора строк из файла разделителем строк принята последовательность 0D0A
(см. файл spf_win_io.f)

Ну я и спрашиваю, почему бы не определить концом строки и 0D, и 0A. Ну, будет пустая строка, но Форту-то всё равно. Зато работать будет со всеми файлами без всяких UNIX-LINES и DOS-LINES.

Добавлено: Вс ноя 16, 2008 06:08

ygrek

Заголовок сообщения:

Файл обрабатывается как одна строка (т.к. разделитель не найден) и первый же комментарий до (остутствующего) конца строки "съедает" весь файл.
Конец строки можно установить явно словами UNIX-LINES и DOS-LINES.
Вообще, используйте решение приведённое в тикете (правда оно там не очень "правильное", но рабочее)

Добавлено: Пт ноя 14, 2008 23:53

chess

Заголовок сообщения:

seu писал(а):

chess
Странное тут то, что разделителем должен являться любой байт, числовое значение которого меньше 33.

Добавлено: Чт ноя 13, 2008 20:11

mOleg

Заголовок сообщения:

seu писал(а):

Странное тут то, что разделителем должен являться любой байт, числовое значение которого меньше 33.
Код:: IsDelimiter1 ( char -- flag ) BL 1+ < ;
VECT IsDelimiter ' IsDelimiter1 (TO) IsDelimiterИли это не так?

Верно в СПФе так и есть, разделителем считается все, что имеет код 32 и меньше. Не знаю, как в стандарте (лень туда смотреть), так было не во всех фортах. Были и такие, в которых кодом разделителя был только пробел = 32, остальные символы включая ноль могли находиться в именах. Была даже такая шутка, как слово REFILL, код которого был = 0x0D0A.

Добавлено: Чт ноя 13, 2008 19:24

seu

Заголовок сообщения:

И вообще, какой смысл искать 0D0A и считать его за разделитель, когда можно искать и 0D, и 0A, и если находить их в паре, считать за два разделителя. Форту ведь всё равно, сколько их там будет.

Добавлено: Ср ноя 12, 2008 23:28

seu

Заголовок сообщения:

chess
Странное тут то, что разделителем должен являться любой байт, числовое значение которого меньше 33.

Код:

: IsDelimiter1 ( char -- flag )
  BL 1+ <
;
VECT IsDelimiter ' IsDelimiter1 (TO) IsDelimiter

Или это не так?

Добавлено: Ср ноя 12, 2008 23:14

ygrek

Заголовок сообщения:

https://sourceforge.net/tracker/index.p ... tid=367919

Добавлено: Ср ноя 12, 2008 10:47

WingLion.Ru

Список форумов » Форт Системы (Forth Systems) » SP-Forth

Часовой пояс: UTC + 3 часа [ Летнее время ]