- Использовать нейросетевой генератор для выбора оптимального варианта?
- Оценить предложенные спелчекером
- Оценить вероятность того, что предложенное генератором было превращено в опечатку
- Поставить в нужную словоформу
- Тезаурус
- Словарь синонимов
- Нужная словоформа
- Нейросетевой генератор (подменять слово из словаря синонимов и восстанавливать исходное)
- Нейросеть вместо словаря Тихонова
- https://github.com/AlexeySorokin/NeuralMorphemeSegmentation Насколько часто вообще в литературе встречается что-то, чего нет в словаре Тихонова?
- Рассогласованность падежей, родов и чисел имен (это постоянно остается при редакторской правке)
- Нарушение управления глаголов
- Штампы https://litnet.com/ru/blogs/post/10751
- Ритм абзаца (длина предожения, второстепенные члены, частотность)
- Легкость чтения (ударения, заменить буквы на категории звуков?)
- Неоднозначное местоимение. "Пашка шел по улице, сжимая в руках кастет. Может, все же по старинке, - подумал он." Кто "он", Пашка или кастет?
- Неопределенные слова: "какой-то", "что-то", "как-то" (автор ты или нет, должен знать, какой, что и как!).
- Олди утверждают, что в романе каждый ПОВ написан разным языком, как и диалоги каждого героя. Не мешало бы проверить.
- Мне не нравится двусмысленность df, когда он загружается из корпуса: зачем ему index и word_id, который всегда такой же?
- добавить вычленение диалогов из текста:
- Найти параграфы, являющиеся диалогами.
- Для каждого токена понять, является ли он частью прямой речи или действием ("сказал он"), либо разметочной информацией (ведущее тире)
- Понять, по возможности, кто это сказал и кому
дока к директ экстрактору - ноут о том, что экстракции по индексу не должно быть и жто правильно (потому что индекс - это индекс конкретно примеров, а значит, с чем это связывать, добавь росто информацию в столбцы!). Воркэраунд - создать колонку дубликат. фидбек в task.run - про энвайронменты (добавить в демо уже наконец про доставку систем и в том числе про энвайронмент рассказать) сделать иммутабельным TFac с помощью copy.deepcopy Как понять, где какая функциональность находится: экстрактор работает со строками, трансформер со столбцами
- https://craftly.ai/tools.html#writing-tool
- https://shortlyai.com/ (https://help.shortlyai.com/getting-started/basics)
- https://www.othersideai.com/
- https://www.copy.ai/# (который поглотил бывший tagline.ai)
- https://www.dover.com/tools/job-description-rewriter
- https://www.reddit.com/r/GPT3/comments/j57pn8/best_gpt3_text_rewriting_and_summarization/g7qzpug/
Как это сделано? Можно ли повторить? Может ли это быть применено к литературе?