Metadata-Version: 2.1
Name: ilyushenko-texttools
Version: 0.0.1
Summary: матвей
Home-page: https://github.com/blessedayoume/texttools.git
Author: MATVEY ILYUSHENKO
Author-email: blessedayoume@gmail.com
Project-URL: GitHub, https://github.com/blessedayoume/texttools.git
Keywords: files speedfiles
Classifier: Programming Language :: Python :: 3.11
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.6
Description-Content-Type: text/markdown
Requires-Dist: requests>=2.25.1

▎TextAnalyzer

Библиотека для анализа текста с простым и понятным API. Предоставляет набор функций для подсчета слов, символов, предложений, поиска самых частых слов и других метрик текста.

▎Что делает библиотека

TextAnalyzer позволяет легко получать статистику о тексте:
• Подсчитывать количество слов и символов
• Находить самые частые слова
• Анализировать структуру текста (количество предложений)
• Вычислять среднюю длину слов
• Находить уникальные слова

Библиотека автоматически обрабатывает пунктуацию и нормализует пробелы, что делает анализ точным и надежным.

▎Примеры использования

from textanalyzer import word_count, char_count, top_words, sentence_count, avg_word_length, unique_words

# Пример текста для анализа
text = "Привет, мир! Это тестовый текст. Он содержит несколько предложений."

# Подсчет слов
print(f"Количество слов: {word_count(text)}")
# Вывод: Количество слов: 8

# Подсчет символов (с пробелами и без)
print(f"Символов (с пробелами): {char_count(text)}")
print(f"Символов (без пробелов): {char_count(text, ignore_spaces=True)}")

# Самые частые слова
print(f"Топ-3 слова: {top_words(text, 3)}")
# Вывод: Топ-3 слова: [('привет', 1), ('мир', 1), ('это', 1)]

# Количество предложений
print(f"Предложений: {sentence_count(text)}")
# Вывод: Предложений: 3

# Средняя длина слова
print(f"Средняя длина слова: {avg_word_length(text):.2f}")

# Уникальные слова
print(f"Уникальные слова: {unique_words(text)}")
# Вывод: Уникальные слова: ['привет', 'мир', 'это', 'тестовый', 'текст', 'он', 'содержит', 'несколько', 'предложений']


▎Список функций

▎word_count(text: str) -> int

Подсчитывает количество слов в тексте. Игнорирует пунктуацию и нормализует пробелы.

▎char_count(text: str, ignore_spaces: bool = False) -> int

Подсчитывает количество символов в тексте. Если ignore_spaces=True, пробелы не учитываются.

▎top_words(text: str, n: int = 3) -> List[Tuple[str, int]]

Находит N самых частых слов в тексте. Возвращает список кортежей (слово, количество), отсортированный по убыванию частоты.

▎sentence_count(text: str) -> int

Подсчитывает количество предложений в тексте. Разделителями считаются ., ! и ?.

▎avg_word_length(text: str) -> float

Вычисляет среднюю длину слова в тексте.

▎unique_words(text: str) -> List[str]

Возвращает список уникальных слов в тексте в алфавитном порядке. Все слова приводятся к нижнему регистру.

▎Как установить

pip install textanalyzer


Библиотека будет доступна на PyPI после завершения разработки.

▎Лицензия

MIT License - вы можете свободно использовать эту библиотеку в коммерческих и некоммерческих проектах.
