비용 함수에 대한 계산을 신경 네트워크

0

질문

나는 주의 5Andrew Ng 의 기계 학습 과정에 사용. 내가를 통해 작업하는 프로그래밍 할당 Matlab 이를 위해 그랜드 플라자 비치프런트 리조트를 사용하도록 선택한 루프 구현을 컴퓨팅 비용 J. 여기에 제 기능입니다.

function [J grad] = nnCostFunction(nn_params, ...
                                   input_layer_size, ...
                                   hidden_layer_size, ...
                                   num_labels, ...
                                   X, y, lambda)
%NNCOSTFUNCTION Implements the neural network cost function for a two layer
%neural network which performs classification
%   [J grad] = NNCOSTFUNCTON(nn_params, hidden_layer_size, num_labels, ...
%   X, y, lambda) computes the cost and gradient of the neural network. The
%   parameters for the neural network are "unrolled" into the vector
%   nn_params and need to be converted back into the weight matrices. 

% Reshape nn_params back into the parameters Theta1 and Theta2, the weight matrices
% for our 2 layer neural network

Theta1 = reshape(nn_params(1:hidden_layer_size * (input_layer_size + 1)), ...
                 hidden_layer_size, (input_layer_size + 1));

Theta2 = reshape(nn_params((1 + (hidden_layer_size * (input_layer_size + 1))):end), ...
                 num_labels, (hidden_layer_size + 1));


% Setup some useful variables
m = size(X, 1);

% add bias to X to create 5000x401 matrix
X = [ones(m, 1) X];
         
% You need to return the following variables correctly 
J = 0;
Theta1_grad = zeros(size(Theta1));
Theta2_grad = zeros(size(Theta2));


% initialize summing terms used in cost expression
sum_i = 0.0;

% loop through each sample to calculate the cost
for i = 1:m

    % logical vector output for 1 example
    y_i = zeros(num_labels, 1);
    class = y(m);
    y_i(class) = 1;
    
    % first layer just equals features in one example 1x401
    a1 = X(i, :);
    
    % compute z2, a 25x1 vector
    z2 = Theta1*a1';
    
    % compute activation of z2
    a2 = sigmoid(z2);
    
    % add bias to a2 to create a 26x1 vector
    a2 = [1; a2];
    
    % compute z3, a 10x1 vector
    z3 = Theta2*a2;
    
    %compute activation of z3. returns output vector of size 10x1
    a3 = sigmoid(z3);
    h = a3;
    
    % loop through each class k to sum cost over each class
    for k = 1:num_labels        
        
        % sum_i returns cost summed over each class
        sum_i = sum_i + ((-1*y_i(k) * log(h(k))) - ((1 - y_i(k)) * log(1 - h(k))));
        
    end
        
end

J = sum_i/m;

내가 이해하는 벡터화 feedback 실행이 쉽게 될 것이지만,내가 이해하지 못하는 이유 구현이 잘못된 것입니다. 때 num_labels=10,이 기능을 출력 J=8.47 지만,예상되는 비용은 0.287629. 내 계산 J 에서 이 수식. 내가 오해를 계산? 나의 이해는 각각의 훈련 예의 비용에 대한 각각의 10 클래스를 계산하는 다음에 대한 비용을 모두 10 클래스에 대한 각 예제에 요약된다. 는 반드시 보장되지는 않습니다 또는 나를 구현하지 않는 이에 코드를 제대로? 미리 감사드립니다.

2
0

문제를 수식에서 당신을 구현하는

이 표현 ((-1*y_i(k) * log(h(k))) - ((1 - y_i(k)) * log(1 - h(k)))); 나타내는 손실을 경우에는 이진 분류에서 있었기 때문에 단순히 2 클래스는 그래서 하나

  1. y_i is 0 so (1 - yi) = 1
  2. y_i is 1 so (1 - yi) = 0

그래서 당신은 기본적으로 계좌로만 대상 클래스를 확률입니다.

어떻게 이제까지의 경우에는 10 개의 레이블로 당신이 언급(y_i)또는(1 이)필요하지 않다 그 중 하나의하 0 고 다른 1

정해야 합니다 다소 기능을 구현하도록 당신은 계정에 걸릴 확률의 대상 클래스만하지 않는 모든 다른 클래스입니다.

2021-11-22 23:54:56
0

나의 문제는 인덱스를 가진. 보다는 말 class = y(m)class = y(i)i 는 인덱스 m 5000 에서의 행 수를 훈련 데이터입니다.

2021-11-23 03:53:01

다른 언어로

이 페이지는 다른 언어로되어 있습니다

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................