📝 文本提取工具功能介绍
🎯 核心功能
智能文本截取工具 - 自动计算文本长度并提取前60%内容
✨ 主要特点
- 📊 智能统计
- 自动计算文本总字符数
- 精确提取前60%内容(自动取整)
- 🖥 交互操作
- 拖拽文件即可处理(支持图形化操作)
- 实时显示处理进度和结果
- 💾 自动保存
- 输出到固定路径:
B:\Desktop\1111.txt
- 自动创建目录(如不存在)
- ⚡ 高效稳定
- 支持大文件处理
- 完善的错误处理机制
🛠 使用场景
- 截取长文本的前半部分内容
- 快速提取文档核心内容
- 文本预处理和抽样
🚀 使用流程
- 运行程序
- 将TXT文件拖入窗口
- 自动处理并保存结果
- 程序自动退出(无残留)
💡 注意:程序仅支持UTF-8编码的TXT文件,处理完成后自动退出,无需人工干预。
import os
import re
import sys
import time
def process_text(filepath):
"""处理文本文件并提取前60%字符"""
try:
with open(filepath, 'r', encoding='utf-8') as f:
content = f.read()
total_chars = len(content)
extract_chars = int(total_chars * 0.6)
print(f"\n文本总字符数:{total_chars}")
print(f"将提取前60%字符:{extract_chars}个字符")
return content[:extract_chars]
except Exception as e:
print(f"\n读取文件时出错:{str(e)}")
sys.exit(1)
def main():
print("="*40)
print(" 文本提取工具 ".center(40, '='))
print("="*40)
print("\n请将txt文件拖拽到本窗口,按回车确认")
filepath = input("\n拖拽文件到此 > ").strip('" \n')
if not filepath.lower().endswith('.txt'):
print("\n错误:仅支持txt文件")
sys.exit(1)
try:
# 设置输出路径
output_dir = r"B:\Desktop"
os.makedirs(output_dir, exist_ok=True)
output_path = os.path.join(output_dir, "1111.txt")
# 处理文件
extracted_content = process_text(filepath)
with open(output_path, 'w', encoding='utf-8') as f:
f.write(extracted_content)
print(f"\n处理完成!结果已保存到:\n{output_path}")
print("\n自动退出...")
sys.exit(0)
except Exception as e:
print(f"\n处理过程中出错:{str(e)}")
sys.exit(1)
if __name__ == "__main__":
main()
