Em 1993, a universidade de Waikato, Nova Zelândia iniciou o desenvolvimento da versão original do software weka (em TCL/TK e C). Em 1997, decidiu reescrever o código em Java, incluindo implementações de algoritmos de modelagem. A versão original do software weka foi um front-end em TCL/TK para modelar algoritmos implementados em outras linguagens de programação, mais algumas utilidades para pré-processamento de detalhes formadas em C para fazer experiências de aprendizagem automática.
Java (software weka 3), que começou a construir-se em 1997, é usado em algumas e muito diferentes áreas, especialmente com finalidades de ensino e de procura. Está disponível livremente ante a licença pública geral GNU. É muito portável, já que está completamente implementado em Java e poderá ser executado em praticamente cada plataforma.
Contém uma extensa coleção de técnicas para pré-processamento de dados e modelagem. É descomplicado de utilizar por um novato, graças à tua interface gráfica de usuário. Software weka suporta várias tarefas padrão de mineração de detalhes, sobretudo, pré-processamento de dados, clustering, classificação, regressão, visualização e seleção.
Uma área importante, que hoje em dia não cobrem os algoritmos incluídos no software weka é a modelagem de fluxos. Simples CLI é a abreviatura de Simples Command-Line Interface (“interface descomplicado de linha de comando”). Trata-Se de uma consola que permite o acesso a todas as opções de software weka através da linha de comandos.
O painel Preprocess tem de opções para importar dados de um banco de fatos de um arquivo CSV, etc., e pra pré-processar esses dados, usando os chamados algoritmos de filtragem. Estes filtros são capazes de ser usados pra transformar os detalhes (como por exemplo, ocasionando fatos numéricos em valores discretos) e pra eliminar registros ou atributos de acordo com alguns critérios pré-especificados. O painel Classify permite ao usuário pôr algoritmos de classificação e análise de regressão pros conjuntos de fatos resultantes. Também permite simpatizar a exatidão do padrão preditivo resultante, por intervenção de curvas ROC, etc
- 2 Sequências de designação
- Classifica os pixéis em pele/sem pele utilizando um padrão de cor
- A arte de vender além da Constelação de VIDRO
- Kevin Turen
- Wikija00 (discussão) 08:Dezessete 12 abr 2019 (UTC)
- três Casamento, começo do governo nazista, primeira atividade política
Finalmente, tem utilitários pra ver o próprio padrão, nos casos em que isto seja possível, como, como por exemplo, uma árvore de decisão. O painel Associado disponibiliza acesso pra os fundamentos de liga aprendidas que tentam distinguir todas as inter-relações primordiais entre os atributos dos dados. O painel Cluster oferece acesso às técnicas de clustering ou agrupamento de software weka como, a título de exemplo, o algoritmo K-means. Este é apenas uma implementação do algoritmo de perspectiva-maximização para estudar uma mistura de distribuições normais. O painel Selected attributes dá algoritmos para distinguir os atributos mais associados em um conjunto de detalhes.
O painel Visualize mostra uma matriz de pontos dispersos (scatterplot), onde cada ponto individual pode ser selecionada e agrandarse para ser analisados em detalhe utilizando inúmeros operadores de seleção. A interface Experimenter (“experimentador”) permite a comparação sistemática de execução dos algoritmos preditivos de software weka sobre isso uma coleção de conjuntos de dados. Knowledge Flow (“fluência de conhecimento”) é uma interface que, em essência, implementa as mesmas funções que o Explorer, e, ademais, permite o “arrastar e soltar”.