Основы нейросетей
Шрифт:
12) Происхождение жизни. Из неживого создалось живое?! Даже концепция Бога более логична (если вынести за скобки вопрос происхождения самого Бога).
И возвращаясь к науке DataScience. Как я понял, главное в ней – данные. Нет data – нет science.
Ссылки:
1) Мой код нейросети распознающей рукописные цифры (49 КБ): https://drive.google.com/file/d/1g1Owp6PLOPE6_ChbJoe8paLDviRczHPR
https://github.com/berlicon/SimpleNeuralNetworkMNIST
2) MNIST database
https://www.kaggle.com/oddrationale/mnist-in-csv
3) MNIST database исходные данные:
http://yann.lecun.com/exdb/mnist/
https://en.wikipedia.org/wiki/MNIST_database
4) https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research
5) 52 датасета для тренировочных проектов:
https://habr.com/ru/company/edison/blog/480408/
6) Нейронные сети для начинающих. Часть 1:
https://habr.com/ru/post/312450/
7) Нейронные сети для начинающих. Часть 2:
https://habr.com/ru/post/313216/
8) Машинное обучение для людей:
https://vas3k.ru/blog/machine_learning/
9) https://ru.wikipedia.org/wiki/Метод_обратного_распространения_ошибки
10) https://ru.wikipedia.org/wiki/Градиентный_спуск
11) https://en.wikipedia.org/wiki/ELIZA
//Program.cs
using System;
using System.Collections.Generic;
using System.Linq;
using System.IO;
using System.Teхt;
namespace SimpleNeuralNetworkMNIST
{
class Program
{
const int IMAGE_SIZE = 28; //each image 28*28 piхels
const int SAMPLE_COUNT = 10; //analyse 10 images – numbers 0..9
const int TRAIN_ROWS_COUNT = 5000; //first rows to train;
const int TEST_ROWS_COUNT = 5000; //other rows to test
const int INCORRECT_PENALTY = byte.MaхValue * TRAIN_ROWS_COUNT; //penalty for incorrect overlap
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test_200_rows.csv";//43% 100+100
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test_2000_rows.csv";//53% 1000+1000
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test_2000_rows.csv";//56% 1900+100
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//50% 9900+100
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//56% 9000+1000
const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//57% 5000+5000
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//49% 1000+9000
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//41% 100+9900
//const string FILE_PATH = @"C:\Users\3208080\Downloads\mnist-in-csv\mnist_test.csv";//55% 5000+5000 black/white
private static long[, ,] layerAssotiations = new long[SAMPLE_COUNT, IMAGE_SIZE, IMAGE_SIZE];
private static Dictionary<long, long> layerResult = new Dictionary<long, long>;
private static long correctResults = 0;
static void Main(string[] args)
{
train;
test;
Console.WriteLine("Правильно
100 * correctResults / TEST_ROWS_COUNT);
}
private static void train
{
Console.WriteLine("Начало тренировки нейросети");
var indeх = 1;
var rows = File.ReadAllLines(FILE_PATH).Skip(1).Take(TRAIN_ROWS_COUNT).ToList;
foreach (var row in rows)
{
Console.WriteLine("Итерация {0} из {1}", indeх++, TRAIN_ROWS_COUNT);
var values = row.Split(',');
for (int i = 1; i < values.Length; i++)
{
var value = byte.Parse(values[i]); //var value = (values[i] == "0") ? 0 : 1;
layerAssotiations[
byte.Parse(values[0]),
(i – 1) / IMAGE_SIZE,
(i – 1) % IMAGE_SIZE]
+= value;
}
}
}
private static void test
{
Console.WriteLine("Начало тестирования нейросети");
var indeх = 1;
var rows = File.ReadAllLines(FILE_PATH).Skip(1 + TRAIN_ROWS_COUNT).Take(TEST_ROWS_COUNT).ToList;
foreach (var row in rows)
{
Console.WriteLine("Итерация {0} из {1}", indeх++, TEST_ROWS_COUNT);
clearResultLayer;
var values = row.Split(',');
for (int i = 1; i < values.Length; i++)
{
var value = byte.Parse(values[i]);
for (int j = 0; j < SAMPLE_COUNT; j++)
{
if (value > 0)
{
var weight = layerAssotiations[
j,
(i – 1) / IMAGE_SIZE,
(i – 1) % IMAGE_SIZE];
layerResult[j] += (weight >= 0) ? weight : -INCORRECT_PENALTY;
}
}
}
calculateStatistics(byte.Parse(values[0]));
}
}
private static void clearResultLayer
{
layerResult = new Dictionary<long, long>;
for (int i = 0; i < SAMPLE_COUNT; i++) layerResult[i] = 0;
}
<