So we have the error function, and you want to minimize it.
This error function (denoted by E) can be mathematically expressed as follows
Эта функция ошибок (обозначаемая Е) может быть математически выражена следующим образом.
Gradient descent is the optimization techniques for nonlinear functions (e.g., the error function of a neural network as the weights are varied) that attempt to move incrementally to successively lower points in search space in order to locate a minimum.
Совокупность методов оптимизации нелинейных функционалов (например, функции ошибок нейронной сети, когда веса сети рассматриваются как аргументы функции), где с целью поиска минимума происходит последовательное продвижение во все более низкие точки в пространстве поиска.
To construct an optimal hyperplane, SVM employs an iterative training algorithm, which is used to minimize an error function.
Для построения оптимальной гиперплоскости, SVM прибегает к итерационному алгоритму обучения, использующемуся для минимизации функции ошибок.
As with neural network learning, we write an error function and compute its gradient with respect to the parameters.
Как и в случае с обучением нейронной сети, запишем функцию ошибки и вычислим ее градиент по отношению к параметрам.
But each of the neurons has its own weights, on which it weighs such signs, and the task of training the network in the selection of such weights for each of the neurons that optimize our error function.
Но у каждого из нейронов свои веса, на которых он взвешивает такие признаки, и задача обучения сети в подборе таких весов у каждого из нейронов, которые оптимизируют эту нашу функцию ошибки.
What we're going to do is incorporate gradient descent and minimization of an error function.
То, что мы собираемся сделать, это использовать градиентный спуск и минимизацию функции ошибки.
As the name implies, gradient descent is a means of descending toward the minimum of an error function based on slope.
Как следует из названия, градиентный спуск является средством снижения к минимуму функции ошибки, основанной на наклоне.
This difference also forms a function that is called error function.
In the diagram, we see the cross-entropy error function and its change with time.
На диаграмме видим кросс-энтропийную функцию ошибок и её изменение с течением времени.
The gradient descent method involves calculating the derivative of the squared error function with respect to the weights of the network.
Метод градиентного спуска включает в себя вычисление производной от квадратичной функции ошибки относительно весов сети.
When we implement gradient descent, we make each weight modification proportional to the slope of the error function with respect to the weight being modified.
Когда мы реализуем градиентный спуск, мы делаем каждую модификацию веса пропорциональной наклону функции ошибки относительно модифицируемого веса.
People sometimes call it the error function or loss function, it depends on the sphere of activity you work in.
Её ещё называют функцией ошибок или функцией затрат, в зависимости от того, в какой сфере деятельности вы работаете.