内容
l是每个样本的损失函数,yi是标签,后面的是预测值,再加上正则化项