يعرف الإحصاء بأنه مجموعة من العمليات التي تشمل جمع البيانات الرقمية، أو الوصفية، وتحليلها، وعرضها في جداول، ورسوم بيانية؛ بغرض تيسير الإدراك والفهم لتلك البيانات، واستنباط، و فهم بعض الحقائق عن تلك البيانات. ويعد علم الإحصاء علما قائما بذاته، ويدرس في تخصص منفرد، إلا أنه أصبح تخصصا مساندا لكثير من العلوم، حيث يقوم بمهمة إثبات بعض الفرضيات، أو التعرف على طبيعة بعض الظواهر. وتستخدم العمليات الإحصائية في كثير من التطبيقات التي تتعامل مع اللغات الطبيعية، منها على سبيل المثال لا الحصر تطبيقات التحليل الصرفي، والنحوي، والدلالي، ونظم الترجمة الآلية، والفهرسة، والبحث، والتشفير.
ونظرا لتوفر الكثير من المدونات النصية على شكل إلكتروني، وتوفر الحواسيب بقدرات تخزين عالية، ووقت معالجة سريع، فقد أصبح عمل الدراسات الإحصائية على اللغات البشرية سهلا وميسرا، ونتج عن هذا كثير من النظريات اللغوية، والأدوات الحاسوبية كالقواميس، والمعاجم والمدققات الإملائية والنحوية، والتطبيقات الحاسوبية كنظم التعلم، والتعليم، والبحث، والترجمة.